NVIDIA có thể giúp khai thác Metaverse

Mục lục:

NVIDIA có thể giúp khai thác Metaverse
NVIDIA có thể giúp khai thác Metaverse
Anonim

Bài học rút ra chính

  • Nvidia gần đây đã trình diễn kỹ thuật biến ảnh 2D thành cảnh 3D chỉ trong vài giây.
  • Phương pháp sử dụng sức mạnh máy tính để ước tính cách ánh sáng hoạt động trong thế giới thực.
  • Siêu đảo là một lĩnh vực mà cảnh 3D rất hữu ích vì chúng có thể được xem từ bất kỳ góc độ máy ảnh nào.
Image
Image

Công nghệ trí tuệ nhân tạo (AI) mới từ Nvidia có thể sớm biến ảnh 2D thành cảnh 3D chỉ trong vài giây, khiến việc tạo ra các không gian ảo đắm chìm như metaverse trở nên đơn giản như xử lý văn bản.

Nvidia gần đây đã trình diễn phương pháp chụp ảnh được gọi là Instant NeRF, sử dụng sức mạnh tính toán để ước tính cách ánh sáng hoạt động trong thế giới thực. Nó có thể biến những bức ảnh cũ của bạn thành một cảnh trò chơi điện tử hoặc nó có thể được sử dụng để huấn luyện rô bốt và ô tô tự lái hiểu được kích thước và hình dạng của các vật thể trong thế giới thực.

"Hình ảnh 3D mang đến một thế giới mới của sự chuyển đổi", Oren Debbi, Giám đốc điều hành của Visionary.ai, một công ty thị giác máy tính chạy các thuật toán 3D trên nền tảng Nvidia, nói với Lifewire trong một cuộc phỏng vấn qua email. "Sử dụng 3D, bạn bắt chước chiều sâu thế giới thực vào cảnh và làm cho hình ảnh trông sống động và chân thực hơn. Bên cạnh AR / VR và máy ảnh công nghiệp, nơi 3D rất phổ biến, chúng ta hiện đang thấy nó được sử dụng trên hầu hết mọi điện thoại thông minh mà không có người dùng thậm chí biết."

Thêm Thứ nguyên

Bức ảnh lấy liền đầu tiên, được chụp cách đây 75 năm bằng máy ảnh Polaroid, nhằm ghi lại thế giới 3D trong hình ảnh 2D một cách nhanh chóng. Giờ đây, các nhà nghiên cứu AI đang làm điều ngược lại: biến một bộ sưu tập ảnh tĩnh thành cảnh 3D kỹ thuật số chỉ trong vài giây.

Được gọi là kết xuất ngược, quy trình sử dụng AI để ước lượng ánh sáng hoạt động như thế nào trong thế giới thực, cho phép các nhà nghiên cứu tái tạo cảnh 3D từ một số hình ảnh 2D được chụp ở các góc độ khác nhau. Nvidia tuyên bố họ đã phát triển một cách tiếp cận để hoàn thành nhiệm vụ này gần như ngay lập tức.

Nvidia đã sử dụng phương pháp này với một công nghệ mới được gọi là trường bức xạ thần kinh, hoặc NeRF. Công ty cho biết kết quả, được đặt tên là Instant NeRF, là kỹ thuật NeRF nhanh nhất cho đến nay. Mô hình chỉ cần vài giây để luyện tập trên vài chục bức ảnh tĩnh và sau đó có thể hiển thị cảnh 3D thu được trong vòng hàng chục mili giây.

"Nếu các biểu diễn 3D truyền thống như lưới đa giác giống với hình ảnh vectơ, thì NeRF giống như hình ảnh bitmap: chúng ghi lại mật độ ánh sáng phát ra từ một đối tượng hoặc trong một cảnh", David Luebke, phó chủ tịch nghiên cứu đồ họa tại Nvidia cho biết trong một thông cáo báo chí: “Theo nghĩa đó, Instant NeRF có thể quan trọng đối với 3D như máy ảnh kỹ thuật số và nén JPEG đối với nhiếp ảnh 2D - làm tăng đáng kể tốc độ, dễ dàng và phạm vi chụp và chia sẻ 3D.”

Việc thu thập dữ liệu để cung cấp NeRF yêu cầu mạng nơ-ron chụp vài chục hình ảnh được chụp từ nhiều vị trí xung quanh cảnh, cũng như vị trí máy ảnh của mỗi bức ảnh đó.

NeRF đào tạo một mạng lưới thần kinh nhỏ để tái tạo lại cảnh bằng cách dự đoán màu của ánh sáng phát ra theo bất kỳ hướng nào, từ bất kỳ điểm nào trong không gian 3D.

Sự hấp dẫn của 3D

Siêu thị là một lĩnh vực mà cảnh 3D rất hữu ích vì chúng có thể được xem từ bất kỳ góc độ camera nào, Brad Quinton, người sáng lập Nền tảng Perceptus cho thực tế tăng cường (AR), nói với Lifewire trong một cuộc phỏng vấn qua email. Giống như chúng ta có thể đi qua một căn phòng trong đời thực và xem nội dung của nó từ nhiều góc độ khác nhau, với cảnh 3D được dựng lại, chúng ta hầu như có thể di chuyển qua một không gian và xem nó từ mọi góc độ.

Image
Image

"Điều này có thể đặc biệt hữu ích để tạo môi trường sử dụng trong thực tế ảo," Quinton nói.

Các chương trình như Object Capture của Apple sử dụng một kỹ thuật gọi là phép đo quang để tạo ra các đối tượng 3D ảo từ một loạt các hình ảnh 2D. Các mô hình 3D sẽ được sử dụng rộng rãi trong các ứng dụng thực tế ảo và AR, Quinton dự đoán. Ví dụ: một số AI, như AI trong Nền tảng AR Perceptus, sử dụng mô hình 3D để tạo ra sự hiểu biết về thế giới thực, cho phép các ứng dụng AR trong thời gian thực.

Việc sử dụng hình ảnh 3D cũng bắt chước chiều sâu thế giới thực trong một cảnh và làm cho hình ảnh trông sống động và chân thực hơn, Debbi nói. Để tạo hiệu ứng Bokeh (hay còn gọi là chế độ chân dung hoặc chế độ điện ảnh), lập bản đồ độ sâu 3D là cần thiết. Kỹ thuật này được sử dụng trên hầu hết mọi điện thoại thông minh.

"Đây đã là tiêu chuẩn cho các nhà quay phim chuyên nghiệp quay phim và đây đang trở thành tiêu chuẩn cho mọi người tiêu dùng", Debbi nói thêm.

Đề xuất: