Giải pháp Genie 2 của Google cho phép tạo ra các thế giới 3D có thể chơi được từ các văn bản và hình ảnh mẫu. Số lượng ứng dụng tiềm năng cho các công cụ AI sinh sinh đang tăng nhanh chóng.
Với mô hình mới trong dòng sản phẩm Genie, Google muốn cung cấp cho những “người sáng tạo” không có kỹ năng xây dựng thế giới một cách thức đơn giản và nhanh chóng để hiện thực hóa ý tưởng của họ.
Genie 2 là một mô hình nền tảng mới có khả năng tạo ra một lượng “vô tận” các môi trường 3D có thể được điều khiển bởi người dùng, theo thông tin từ Google. AI sinh sinh này có thể phát triển một thế giới ảo hoàn toàn dựa trên một văn bản duy nhất và một hình ảnh mẫu, mà có thể là do người dùng tạo ra hoặc được tạo ra bởi các mô hình AI bên ngoài.
Các công ty khác cũng đang cố gắng biến công nghệ AI sinh sinh thành những tác phẩm xây dựng thế giới, mặc dù kết quả có thể khác nhau. Thí nghiệm Oasis được thiết kế để tạo ra trải nghiệm giống Minecraft từ từng khung hình, nhưng hiện tại nó chỉ giống như một phiên bản Minecraft độ phân giải thấp bị ảnh hưởng bởi chứng suy giảm nhận thức. Google đảm bảo rằng Genie 2 có thể duy trì một thế giới nhất quán trong vòng một phút, mặc dù chúng ta vẫn đang nói về một hình ảnh mờ, khó nhìn và rất khó chịu.
Dù vậy, Google dường như không quan tâm đến vấn đề gây phản cảm về mặt thị giác hay thung lũng kỳ quái. Mountain View đã nhấn mạnh rằng trò chơi đóng vai trò quan trọng trong nghiên cứu AI, cung cấp một môi trường lý tưởng để thử nghiệm các khả năng mới. Các thế giới của Genie 2 có thể được điều khiển bởi một người sử dụng bàn phím và chuột truyền thống, với mô hình sinh sinh mô phỏng tất cả các hệ quả của hành động của người chơi.
Khác với SIMA mới được công bố, Genie 2 có khả năng cung cấp phản ứng hình ảnh “thông minh” trong một môi trường ảo vô tận. Mô hình AI này có thể tạo ra những lộ trình khác nhau, hay còn gọi là “trải nghiệm phản thực tế”, để đào tạo các tác nhân, bắt đầu từ cùng một khung cơ bản. Với những hành động khác nhau của người chơi, thế giới xung quanh sẽ thay đổi và hiện lên một cách tương ứng.
Genie 2 cũng có khả năng ghi nhớ những phần đã được tạo ra trước đó của thế giới ảo mà không nằm trong khung hình của người chơi, và thậm chí có thể tái tạo chúng “chính xác” khi chúng quay lại khung hình. Mô hình này có thể tạo ra nhiều góc nhìn khác nhau cho người chơi, bao gồm góc nhìn thứ nhất, góc nhìn isometric và buồng lái của người điều khiển ở góc nhìn thứ ba. Các cấu trúc 3D phức tạp và tương tác giữa các đối tượng cũng được đưa vào trong mô hình.
Những khả năng bổ sung của mô hình nền mới này bao gồm hoạt hình nhân vật, NPCs, vật lý, khói, trọng lực, ánh sáng và phản chiếu. Google cho biết rằng Genie 2 và các công nghệ AI sinh tạo tương tự có thể hữu ích trong việc tạo mẫu và thử nghiệm các trải nghiệm tương tác, với trò chơi điện tử là ứng dụng tiềm năng đầu tiên được nghĩ đến. Nghiên cứu này vẫn đang ở giai đoạn đầu, điều này có nghĩa là còn rất nhiều cơ hội cải tiến trong các buổi huấn luyện mô hình tiếp theo.
Theo Techspot