Karşınızda Roblox Cube: 3D ve 4D için Temel Üretken Yapay Zekâ Sistemimiz

  • Üretken yapay zekâ için Cube 3D temel modelimizi yayımlıyoruz.
  • Ayrıca Cube 3D temel modelinin bir sürümünü de açık kaynak olarak kullanıma sunuyoruz.
  • Cube 3D mesh neslinin beta sürümü, Roblox Studio'da ve deneyim içi bir Lua API olarak bu hafta kullanıma sunulacak.

Geçen sonbaharda, Roblox'ta 3D nesneler ve sahneler oluşturmak için açık kaynak bir 3D temel modelin inşasına olanak tanıyan iddialı bir projeyi duyurmuştuk. Bu hafta, söz konusu modelin ilk sürümünü açık kaynak olarak yayımlıyor ve Roblox platformunda veya dışında herkesin kullanımına sunuyoruz. Bu modele Cube 3D adını verdik. Mesh oluşturma API'mizin beta lansmanıyla bu modelin yeteneklerinden ilkini de sunuyoruz. Cube, son derece karmaşık sahne oluşturma araçları da dâhil olmak üzere önümüzdeki yıllarda geliştireceğimiz yapay zekâ araçlarının çoğunun temelini oluşturacak. Hedef; metin, resim, video ve diğer girdi türleri konusunda eğitilmiş çok modlu bir model sağlamak. Bu model mevcut yapay zekâ oluşturma araçlarımızla da entegre olarak çalışabilecek!

Cube 3D, doğrudan metinden 3D modeller ve ortamlar üretir ve ileride bunu görüntü girdilerinden de yapabilecektir. Günümüzde, son teknoloji 3D oluşturma sistemleri, görüntüleri ve yeniden yapılandırma yaklaşımını kullanarak 3D nesneler inşa eder. Yeterli 3D eğitim verisi olmadığında bu iyi bir seçenektir. Bununla birlikte platformumuzun doğası gereği biz, eğitimi yerel 3D verilerle yapıyoruz. Oluşturulan nesneler günümüz oyun motorlarıyla tam uyumludur ve işlevsel hâle gelmeleri için genişletilebilirler.

Buradaki fark, bir yarış pisti film setine benzer. Televizyonda tribünleri, garajları ve podyumuyla tamamen işlevsel bir yarış pistine benzer bir şey görürüz. Ama o sete adım atarsak yapıların aslında düz olduğunu hemen fark ederiz. Gerçekten sürükleyici bir 3D dünya inşa etmek, arabanla girebileceğin garajlar, oturabileceğin tribünler ve işlevsel bir podyum ile eksiksiz, işlevsel yapılar gerektirir.

Bunu başarmak için metin dizgecikleri (veya karakter kümeleri) konusunda eğitilmiş son teknoloji modellerden ilham aldık ki bir sonraki dizgecik hakkında tahmin yürüterek cümle oluşturulabilsin. İnovasyonumuz aynı temel fikir üzerine inşa ediliyor. 3D nesneleri dizgecik hâline getirme ve şekilleri dizgecik olarak anlama yeteneğini geliştirdik ve eksiksiz bir 3D nesne oluşturmak için bir sonraki şekil dizgeciğini tahmin etmek üzere Cube 3D'yi eğittik. Bunu genişleterek tam bir sahne oluşturduğumuzda Cube 3D daha sonra düzeni ve bu düzeni tamamlamak için şekli de yinelemeli olarak tahmin eder.

Herkes kendi ihtiyaçlarına göre Cube 3D'ye ince ayar yapabilir, eklentiler geliştirebilir veya onu eğitebilir. Yapay zekâ araçlarının açıklık ve şeffaflık üzerine inşa edilmesi gerektiğine inanıyoruz, bu yüzden açık kaynaklı yapay zekâ topluluğunda kararlı bir ortağız. Piyasaya bir yapay zekâ güvenlik modeli sürdük çünkü yapay zekâ güvenliğindeki gelişmeleri paylaşmanın, tüm sektörün inovasyonu ve teknik gelişmeleri hızlandırmasına yardımcı olduğunu düşünüyoruz. Bu nedenle, açık kaynak güvenlik araçlarıyla dijital güvenlikteki önemli alanlarla mücadele etmeye adanmış, kâr amacı gütmeyen yeni bir kuruluş olan ROOST'un kurulmasına da katkıda bulunduk. Açık kaynak Cube 3D'de amacımız; araştırmacıların, geliştiricilerin ve daha geniş yapay zekâ topluluğunun endüstri çapında 3D oluşturmayı öğrenmesini, zenginleştirmesini ve ilerletmesini sağlamaktır.

Yaratım için Cube 3D

Daha önce yapay zekâyla 3D varlık, aksesuar ve deneyim oluşturmanın nasıl hızlandırılabileceğinden bahsetmiştik. Sonunda yapay zekâ daha da sürükleyici ve kişiselleştirilmiş oyunlar ile bağlantılar sağlayacaktır. Oluşturma döngüsünün her aşamasında yapay zekâyı desteklemek amacıyla hem bu deneyimleri geliştirenler hem de deneyimlerde zaman geçiren kullanıcılar için altyapıya yatırım yapıyoruz. Geliştiricilerin, deneyimlerinde yapay zekâyı etkinleştirerek kullanıcılarına yaratıcılık için yeni yollar sunacağı bir gelecek öngörüyoruz. Bu, yapay zekânın gücünü oyunlarının bir parçası olarak 85 milyondan fazla günlük aktif kullanıcının ellerine bırakıyor.

Geçtiğimiz yıl, geliştiricilere saatlerce manuel çalışma yapmak zorunda kalmadan yaratım gerçekleştirmek için ihtiyaç duydukları araçları ve yetenekleri sağlamak üzere Roblox Studio'da yapay zekâ destekli Asistanımız aracılığıyla birkaç yeni özellik sunduk. Cube ile 3D yaratımı daha verimli hâle getirmeyi amaçlıyoruz. 3D mesh üretimi ile geliştiriciler yeni yaratıcı doğrultuları hızlı bir şekilde keşfedebilir ve hangisine yöneleceklerine hızla karar vererek üretkenliklerini artırabilir.

Bir yarış pisti oyunu inşa ettiğini düşün. Bugün, Asistan içindeki Mesh Oluşturma API'sini kullanarak "/bir motosiklet oluştur" veya "/turuncu güvenlik konisi oluştur" gibi komutları çabucak yazabilirsin. API, saniyeler içinde bu nesnelerin mesh sürümünü oluşturacaktır Bunlar daha sonra doku, renk vb. ile detaylandırılabilir. Bu API ile dekor modelleyebilir veya çok daha hızlı mekân tasarımı yapabilirsin. Basit nesneleri modellemek için saatler harcamana gerek yok. Pist düzenini tasarlamak ve aracın yol tutuşunda ince ayar yapmak gibi eğlenceli şeylere odaklanmanı sağlar. Bu API, oluşturulan her nesneye saatler kazandırır ve çok fazla zaman veya çaba harcama konusunda endişelenmeden yeni fikirleri deneyecek zamanı sağlar. Daha uzun vadede daha karmaşık ve işlevsel nesneleri hatta sahneleri sunmayı planlıyoruz.

Cube ile oluşturulan 3D nesneler

Arazi lastikleri olan kırmızı bir araba
Pürüzsüz hatları olan, kadife döşemeli nostaljik bir yeşil kanepe
Altın işlemelerle bezeli, yeşil kristalden fantastik kılıç
Kahverengi deri motorcu ceketi
Yelesi ve kuyruğu gökkuşağı renklerinde tek boynuzlu at
Çizgi balina

Bu teknoloji, her gün Roblox'ta oyun oynayan ve bağlantılar kuran on milyonlarca yaratıcı insana kadar uzanıyor. Geliştiricilerin, kullanıcılara yapay zekâyla yaratıcılıklarını gösterme olanağı sunduğu bir gelecek görüyoruz. Mesh Oluşturma API'si etkinleştirildiğinde oyuncular, hayal edebilecekleri her şeyi hayata geçirebilirler. Bir oyuncu fütüristik bir araba istiyorsa "geleceğin yandan kanatlı kırmızı arabası" veya "siyah deri motosiklet ceketi" yazıp bunun oluşturulduğunu görebilir. Oyun içinde yapay zekâyla bunları oluşturma imkânı, yepyeni bir yaratıcılık seviyesinin gelişmesini sağlayacaktır. Oyuncular deneyimlerini geliştiricilerin asla hayal edemeyeceği şekilde kişiselleştirebilirler, bu da oyunlarını daha da ilgi çekici kılar.

Derin Bakış: 3D ve Metin/Görüntü Dizgeciklerinde İlişkili Odaklanma (Cross Attention)

Başlıca teknik zorluk, metin ve görüntülerin 3D şekillerle bağlantısını kurmaktı. Temel teknik atılımımız ise 3D dizgecik hâline ayırma (tokenizasyon) oldu, böylece tıpkı metnin dizgecik olarak gösterilebilmesi gibi 3D nesnelerin de dizgecik olarak gösterilmesini sağladık. Bu bize tıpkı dil modellerinin cümle içinde bir sonraki kelimeyi tahmin etmesi gibi bir sonraki şekli tahmin etme yeteneği verir.

3D oluşturulması için tasarladığımız birleşik mimaride tek nesnenin otoregresif oluşturulması, şekil tamamlama ve çoklu nesne/sahne düzeni oluşturma mümkündür. Otoregresif dönüştürücüler, önceki girdileri kullanarak bir sonraki bileşeni tahmin eden sinir ağlarıdır. Bu mimari hem ölçeklenebilirlik hem de çok modlu uyumluluk sağlar, böylece modeli genişlettikçe birçok farklı girdi türüyle (metin, görsel, ses ve 3D) çalışacaktır. Bu modeli açık kaynaklı hâle getiriyoruz. Bu ilk aşamada, yaratıcılar metin istemlerine dayalı olarak 3D nesneler oluşturabilir. Gelecekte, yaratıcıların çok modlu girdilere dayalı olarak tüm sahneleri oluşturabilmelerini amaçlıyoruz.

Şekil oluşturma amacıyla önceden eğitilmiş üretken bir dönüştürücüyü (GPT) eğitmek için ayrı 3D şekil dizgecikleri kullanır ve bunları yazılı komutlarla hizalarız. Bu yeni yaklaşım bizi oynanabilir 3D sahne oluşturma dünyasına hazırlıyor.

Cube nereye gidiyor?

Bugün yapay zekâ, tüm dünyada çoğunlukla metinler ile ilgili olarak cümle içindeki kelimeleri tahmin etmek için kullanılıyor. Görüntüler için, yani pikselleri tahmin etmek için yapay zekâ kullanımının da birçok örneği var. Tüm bu unsurların bir araya gelerek belli bir bağlam içinde karşılıklı işlev göstermesinin gerekli olduğu sahneler oluşturmak istendiğinde ise bu iş çok daha karmaşık hâle gelir. Örneğin "ağaçlarla çevrili bir yarış pistinin önünde motosiklet üzerindeki avatar" olarak tanımlanabilecek basit bir sahnenin olduğu bir deneyim hayal edelim.

Bu deneyimin inşasında birçok unsur vardır. Ağaçlar iki 3D ağın birleşimidir; motosiklet, detaylar ve üçgenler içeren yoğun bir ağdır, binalar da Roblox parçalarından oluşur. Motosiklet üzerindeki avatar; vücudu, uzuvları ve başı için daha karmaşık geometrik özelliklere sahiptir. Son olarak, hepsini belli bir düzende birbirine bağlamanın bir yolunu bulmamız gerek. Bunun için bir nesnenin dış çizgilerini belirleyerek büyüklüğünü ve konumunu tanımlayacak, böylelikle geometrisini düzenlememizi sağlayacak sınırlayıcı kutulara ihtiyacımız var. Bu zahmetli bir süreçtir ancak yapay zekâ sürecin her adımına destek olabilir. Yapay zekâ ile yaratıcılar ilk sürüme daha hızlı ulaşabilir ve yeni fikirleri test etmek veya sahnelerini iyileştirmek için daha fazla zaman bulur.

Bu aşamaya geldiğimizde, oluşturduğumuz 3D nesnelerin ve sahnelerin tamamen işlevsel olmasını isteriz. Buna 4D yaratım adını veriyoruz ve dördüncü boyutu nesneler, ortamlar ve insanlar arasındaki etkileşim meydana getiriyor. Bunu başarmak için sürükleyici 3D nesneler ve sahneler oluşturmak yetmez, nesneler arasındaki bağlamları ve ilişkileri anlama yeteneği de gerekir. İşte Cube ile hedeflediğimiz yön bu.

Mesh üretiminin bu ilk kullanım alanının ötesinde, sahne üretimi ve anlayışını genişletmeyi planlıyoruz. Kullanıcılara en çok ilgilendikleri deneyimleri sunabilecek ve bağlam içinde nesneler ekleyerek sahneleri zenginleştirebileceğiz. Örneğin bir orman sahnesinin olduğu bir deneyimde geliştirici, mevsim değişikliğini belirtmek için Asistan'dan ağaçlardaki tüm yeşil yaprakları sonbahar yapraklarıyla değiştirmesini isteyebilir. Yapay Zekâ Asistan araçlarımız, geliştiriciden gelen isteklere yanıt vererek deneyimlerini hızla oluşturmalarına, uyarlamalarına ve ölçeklendirmelerine yardımcı olur.

We’ll share updates and new functionality as we continue improving and expanding our foundation model. Until then, we hope you enjoy using and building on top of our open-source version of the Cube 3D model, which you can access on GitHub and HuggingFace.