Model dunia — algoritma AI yang mampu menghasilkan lingkungan simulasi secara real-time — mewakili salah satu aplikasi pembelajaran mesin yang lebih mengesankan. Pada tahun lalu, ada banyak pergerakan di lapangan, dan untuk itu, Google DeepMind mengumumkan Genie 2 pada hari Rabu. Jika pendahulunya hanya terbatas pada menghasilkan dunia 2D, model baru ini dapat menciptakan dunia 3D dan mempertahankannya secara signifikan lebih lama.
Genie 2 bukanlah mesin permainan; sebaliknya, ini adalah model difusi yang menghasilkan gambar saat pemain (baik manusia atau agen AI lainnya) bergerak melalui dunia yang disimulasikan oleh perangkat lunak. Saat menghasilkan bingkai, Genie 2 dapat menyimpulkan gagasan tentang lingkungan, memberinya kemampuan untuk memodelkan efek air, asap, dan fisika — meskipun beberapa interaksi tersebut bisa sangat rumit. Model ini juga tidak terbatas pada rendering adegan dari sudut pandang orang ketiga, tetapi juga dapat menangani sudut pandang orang pertama dan isometrik. Yang diperlukan untuk memulai hanyalah satu prompt gambar, yang disediakan oleh model Imagen 3 milik Google atau gambar sesuatu dari dunia nyata.
Memperkenalkan Genie 2: model AI kami yang dapat menciptakan beragam dunia 3D yang dapat dimainkan tanpa batas – semuanya dari satu gambar. 🖼️
Model dunia dasar skala besar seperti ini dapat memungkinkan agen masa depan untuk dilatih dan dievaluasi dalam lingkungan virtual yang jumlahnya tidak terbatas. →… pic.twitter.com/qHCT6jqb1W
— Google…