Perjalanan Roblox Mewujudkan AI Generatif 4D
-
Roblox tengah membangun AI generatif 4D, dan beralih dari objek 3D tunggal menuju interaksi dinamis.
-
Pemahaman menyeluruh tentang penampilan, bentuk, fisika, dan skrip akan sangat diperlukan untuk memecahkan tantangan teknologi 4D.
-
Berbagai alat awal yang mendasari sistem 4D kami telah mempercepat proses kreasi di platform ini.
Roblox menunjang kreator agar bisa menciptakan pengalaman virtual 3D imersif, avatar, dan aksesori dengan menyediakan alat, layanan, dan dukungan yang diperlukan untuk mewujudkan gagasan kreator. Para kreator inilah yang telah menciptakan konten yang hidup di platform kami, serta menarik lebih dari 77 juta pengguna aktif harian (per Q1 2024). Melalui aplikasi gratis Roblox Studio, kami telah meluncurkan serangkaian alat AI generatif yang dirancang khusus untuk alur kerja Roblox dan dilatih dengan konten khusus Roblox.
Alat-alat ini dapat memudahkan proses kreasi, meningkatkan efisiensinya, dan membuatnya makin menyenangkan baik bagi pemula maupun yang sudah berpengalaman. Assistant memungkinkan pengeditan workspace 3D, Animation Capture memfasilitasi gerakan wajah dan tubuh, Code Assist membantu pengeditan dan pembuatan skrip, Generator Material membantu dalam tiling tampilan material, dan Generator Tekstur memungkinkan pemetaan tekstur khusus aset tertentu. Setiap alat AI generatif ini menyempurnakan satu bagian dari proses kreatif 3D.
Perpaduan semua alat ini dapat menunjang keterampilan kreator dan mengurangi waktu pengerjaan, mulai dari konsep sampai penyelesaian. Kami telah membangun alat-alat tersebut dengan memanfaatkan terobosan riset inovatif kami, serta solusi terbaik dari ekosistem AI yang lebih besar. Alat-alat ini dapat menangani pembuatan aset individual dalam 1D (skrip), 2D (permukaan), dan 3D (ruang). Kami menampilkan sebagian dari hasil lab pembuatan dan pengeditan geometri 3D kami di berbagai konferensi riset internasional, termasuk Konferensi Developer Roblox kami.
Di industri ini, 1D dan 2D adalah teknologi unggulan, sedangkan 3D merupakan teknologi AI generatif paling mutakhir. Masing-masing memberikan tantangan yang makin signifikan dan terus mendorong peningkatan teknis. Karena kita hidup di ruang 3D, dimensi tersebut mungkin sekilas terasa seperti tantangan terbesar untuk AI generatif. Namun, berdasarkan kebutuhan komunitas, kami punya visi yang lebih jauh untuk hal ini.
Teknologi Kami Saat Ini
Kami tengah mengembangkan AI generatif 4D, dengan interaksi sebagai dimensi keempatnya. Kekuatan platform online Roblox adalah interaksi antara pengguna, objek, dan lingkungan. Berbeda dengan video game online tradisional, mesin runtime Roblox yang canggih dapat memanfaatkan pemrograman dan model simulasi unik yang berfokus pada interaksi. Model ini terinspirasi oleh konsep metaverse, tempat berbagai unsur bertemu dengan cara yang kompleks, lebih bebas, dan spontan, ketimbang dengan cara yang kaku dan terbatas.
Alat AI generatif 1D, 2D, dan 3D menghasilkan aset individual. Tantangan yang kami hadapi terkait AI generatif 4D adalah menghadirkan aset tersebut dengan cara yang memungkinkan interaksi tak terbatas yang sesuai dengan platform kami. Sebagai contoh, avatar tidak hanya terdiri dari bentuk dan warna, tetapi juga kerangka, animasi, serta kemampuan meraih alat dan keseimbangan. Avatar tersebut bisa memakai pakaian yang tidak secara khusus dirancang untuknya, dan pakaian itu akan disesuaikan secara otomatis agar pas dan mengikuti semua gerakannya. Alat Penyiapan Otomatis Avatar baru kami adalah contoh mula-mula dari otomatisasi yang dapat didukung oleh AI generatif untuk jenis kreasi seperti ini. Developer kini bisa menyelesaikan proses ini hanya dalam beberapa menit, alih-alih berjam-jam atau berhari-hari.
Mobil sport kini tidak hanya punya bentuk dan cat permukaan yang menawan, tetapi juga mesin, komponen bergerak, dan rig fisika yang membuatnya dapat melaju di jalanan virtual dengan presisi dan kontrol yang baik. Dalam setiap kasus, objek diperluas dari 3D agar bisa berinteraksi dengan semua komponennya melalui fisika dan dengan pengguna melalui avatar.
Masing-masing dari elemen 4D yang sangat interaktif ini bisa ditambahkan ke dalam lingkungan yang lebih besar. Di lingkungan tersebut, AI generatif dapat menyelaraskan gaya setiap unsur dan menunjang interaksi antarobjek serta antara objek dan lingkungan. Melalui avatarnya, kini pengguna bisa berkendara dalam balapan jalanan dengan modifier kerusakan dan skor tertinggi, lalu berhenti di toko busana bermerek untuk membeli baju baru dan merayakan kemenangan.
Saat ini, pembuatan pengalaman virtual seperti itu memerlukan pembuatan kode sumber skrip, workspace dan struktur model data, geometri 3D, animasi, dan material secara manual. Alat AI generatif kami dapat membantu melakukan setiap bagian pengerjaan. Kami membangun sistem yang akan menghubungkan semua unsur ini dan membuatnya secara bersamaan. Agar bisa mewujudkannya, kami harus melatih sistem AI generatif 4D kami dengan cara yang multimodal, yang artinya dilakukan dengan berbagai tipe data secara bersamaan. Kami sudah menerapkannya untuk gambar dan teks, yang menunjang kinerja Generator Material. Memungkinkan interaksi dan menambahkan pengoptimal fisika yang dirancang khusus adalah cara kami mewujudkan kapabilitas 4D yang lebih mutakhir.
Dalam setahun terakhir saja, kami sudah menerapkan banyak perubahan terhadap cara pembuatan konten di Roblox. Ke depannya, kami membayangkan terwujudnya masa depan yang memungkinkan siapa saja, dari mana saja, dan kapan saja mewujudkan gagasan mereka hanya melalui perintah teks atau suara. Untuk bisa sampai ke sana, kami perlu mulai memecahkan sejumlah tantangan yang akan kami hadapi.
Tantangan di Depan
Eksperimen yang kami sampaikan di atas tak lama lagi akan tersedia. Ke depannya, kami menghadapi tiga tantangan yang perlu diselesaikan:
1. Fungsional: Objek yang dibuat dengan alat AI generatif masa depan ini harus bersifat fungsional. Artinya, sistem mampu melihat truk atau pesawat yang berbentuk 3D, dan tidak memperlakukannya sebagai objek padat yang tidak tembus cahaya. Tanpa intervensi kreator, sistem dapat secara otomatis mengenali komponen yang memerlukan sendi, atau yang mesh-nya perlu dibuka.
Ini adalah masalah AI di tingkat manusia yang perlu dipecahkan oleh sistem—contohnya, menentukan penempatan roda yang tepat, lalu menambahkan as pada roda agar bisa beroperasi seperti di dunia nyata. Contoh lainnya adalah mencari letak pintu, lalu membuat rongga dan menambahkan engsel agar pintu bisa dibuka dan ditutup.
2. Interaktif: Item yang dibuat dengan AI generatif masa depan ini juga harus bisa berfungsi secara terpisah sekaligus berinteraksi dengan objek lain dalam lingkungan yang sama. Setelah membuatkan mobil dengan pintu yang bisa dibuka dan roda yang bisa berputar, sistem itu juga harus memahami fisika yang berlaku di dunia tempat mobil itu berada. Bagaimana cara kendaraan bergerak di atas medan tertentu? Jika menabrak batu besar, bagaimana kendaraan itu akan penyok, dan di mana letak penyoknya berdasarkan ukuran batu dan kecepatan kendaraan?
Untuk memecahkan tantangan yang kompleks ini, objek yang dibuat dan lingkungan/objek yang menjadi target interaksinya harus saling memahami prinsip fisika yang berlaku. Untungnya, Roblox punya keunggulan dalam hal ini karena platformnya dibangun sebagai mesin fisika, yang artinya semua objek dalam pengalaman virtual dapat diatur agar mematuhi hukum fisika. Ketika AI generatif membuat objek 4D, kualitas fisika objek tersebut, misalnya material, massa, dan kekuatan juga akan ditambahkan agar objek ini siap berinteraksi dengan objek lain berdasarkan fisika yang berlaku di dunia tersebut.
3. Dapat Dikontrol: Saat ini, interaksi dengan AI generatif masih dilakukan menggunakan perintah. Ini bukanlah sistem yang sempurna, mirip dengan perburuan harta karun. Orang yang meminta gambar kelinci dapat menerima berbagai macam hasil: kelinci sungguhan, cokelat berbentuk kelinci paskah, kelinci kartun, lukisan kelinci, atau ilustrasi kelinci yang mengenakan mantel. Jadi, kita mempersempit perintahnya dan meminta gambar fotorealistis atau gambar “dengan gaya tertentu” untuk menuangkan gagasan yang kita bayangkan. Proses ini memakan waktu dan harus diulang beberapa kali agar makin mendekati hal yang dicari.
Bayangkan jika kita mengikuti proses ini untuk objek 3D yang dapat berfungsi dan berinteraksi dengan objek lain, misalnya, truk dalam contoh di atas. Rekayasa perintah di level ini akan jauh lebih kompleks dan bukanlah hal yang bisa dengan mudah digunakan semua orang. Untuk mewujudkan gagasan para kreator, kami membutuhkan cara yang lebih cepat dan mudah untuk disampaikan dan disempurnakan. Pada dasarnya, cara ini adalah kolaborasi dengan asisten AI yang lebih mirip dengan partner, dan bukan bermain berburu harta karun.
Tantangan ini dihadapi di seluruh industri, dan ada banyak perusahaan yang berusaha menghadirkan kontrol yang lebih baik ke dalam AI generatif. Kami telah mencapai kemajuan yang berarti berkat alat-alat tertentu, seperti ControlNet, yang meningkatkan kontrol dengan menyediakan akses kepada kreator untuk memberikan kondisi input tambahan, dan bukan hanya perintah teks. Kami tengah mencari metode lain yang berpotensi menghasilkan alur kerja yang memuaskan, misalnya, membuat AI berhenti sejenak setelah melakukan langkah penting untuk menunggu input dari pengguna. Namun, perjalanan menuju penggunaan dengan tingkat kelancaran seperti itu masih panjang.
Kami senang dengan dampak yang bisa kami berikan sejauh ini, dan lebih bersemangat menyambut kemungkinan yang akan datang. Dibandingkan dengan kreator yang tidak menggunakan versi beta Generator Material, pengguna versi beta telah meningkatkan penggunaan variasi material render berbasis fisika (PBR) sebanyak lebih dari 100 persen—naik dari sekitar seribu pada bulan Maret 2023 menjadi lebih dari dua ribu pada bulan Juni 2024. Per 2 Juni 2024, kreator telah menerapkan sekitar 535 juta karakter kode yang disarankan oleh Code Assist.
Seiring dengan keberhasilan kami untuk mulai memecahkan tantangan dalam perjalanan mewujudkan teknologi 4D ini, para kreator akan bisa lebih banyak dan lebih cepat berkreasi. Kami juga berharap bisa melihat pengalaman virtual yang lebih beragam di Roblox dengan memberi lebih banyak orang peluang untuk menjadi kreator. Kreasi yang mereka buat dan cara mereka membuatnya akan membantu kami menentukan aspek yang perlu kami kembangkan terkait dengan alat dan algoritma AI baru untuk menunjang para kreator baru ini, selain tentunya menunjang komunitas kami saat ini.
Dengan AI generatif 4D, Roblox telah membuka ranah baru dalam pembuatan pengalaman virtual dan aset. Meski tantangannya terbilang baru, proses inovasi kami sudah teruji. Kami memadukan riset internal dan tim pengembangan unggulan, kolaborasi dengan perguruan tinggi, dan iterasi cepat terhadap prototipe melalui hubungan kemitraan dengan komunitas kami.