GPT-4.1: Daha İyi Kod, Daha Fazla Hız, Daha Az Bekleme
- YAPAY ZEKA
- 15:13, May 17
“Genesis”, metinden yaratılan 3D dünyaları kullanarak eğitim sürelerini onlarca yıldan saatlere sıkıştırabiliyor.
Geçtiğimiz günlerde, üniversite ve özel sektör araştırmacılarından oluşan büyük bir grup, robotların simüle edilmiş gerçeklikteki görevleri gerçek dünyadakinden 430.000 kat daha hızlı uygulamasına olanak tanıyan yeni bir açık kaynaklı bilgisayar simülasyon sistemi olan Genesis'i tanıttı. Araştırmacılar ayrıca metin komutlarından 3D fizik simülasyonları oluşturmak için bir yapay zeka aracısı sunmayı planlıyor.
Hızlandırılmış simülasyon, robotlara pilotluk yapan bir sinir ağının, sadece saatler süren gerçek bilgisayar süresinde nesneleri almayı, yürümeyi veya aletleri manipüle etmeyi öğrenmek için onlarca yıla eşdeğer sanal zaman harcayabileceği anlamına geliyor.
“Bir saatlik hesaplama süresi bir robota 10 yıllık eğitim deneyimi kazandırıyor. Neo, Matrix Dojo'da dövüş sanatlarını göz açıp kapayıncaya kadar bu şekilde öğrenebildi,” diye yazıyor araştırmada ‘küçük bir rol’ oynadığını söyleyen Genesis makalesinin ortak yazarı Jim Fan on X'te. Fan daha önce Nvidia için çeşitli robotik simülasyon projeleri üzerinde çalışmıştı.
Genesis, robotik araştırmacılarının robotları gerçek dünyaya yerleştirmeden önce sanal ortamlarda test etmek ve eğitmek için daha iyi araçlar aradığı bir dönemde ortaya çıktı. Hızlı ve doğru simülasyon, robotların karmaşık görevleri daha hızlı öğrenmesine yardımcı olurken pahalı fiziksel testlere olan ihtiyacı da azaltıyor. Örneğin, bu proje sayfasında araştırmacılar Genesis fizik simülasyonlarında geliştirilen tekniklerin (ters takla atma gibi) dört ayaklı robotlara ve yumuşak robotlara uygulandığını gösteriyor.
Carnegie Mellon Üniversitesi'nden Zhou Xian liderliğindeki bir grup tarafından geliştirilen Genesis platformu, fizik hesaplamalarını mevcut robot simülatörlerinden (Nvidia'nın Isaac Gym'i gibi) 80 kata kadar daha hızlı işliyor. Bir simülasyonun 100.000 kopyasını aynı anda çalıştırmak için video oyunlarına güç verenlere benzer grafik kartları kullanıyor. Bu, gelecekteki gerçek dünya robotlarını kontrol edecek sinir ağlarını eğitmek söz konusu olduğunda önemlidir.
Fan, X yazısında “Eğer bir yapay zeka 1,000 robotu 1 milyar farklı simülasyonda 1 milyon beceri gösterecek şekilde kontrol edebiliyorsa, o zaman bizim gerçek dünyamızda da ‘işe yarayabilir’, ki bu da olası gerçekliklerin uçsuz bucaksız uzayında sadece bir başka noktadır” diye yazdı. “Bu, simülasyonun robotik için bu kadar etkili çalışmasının ardındaki temel ilkedir.”
Dinamik dünyalar oluşturma
Ekip ayrıca “4D dinamik dünyalar” adını verdiği bir dünya yaratma becerisi üzerinde çalıştıklarını da duyurdu - belki de “4D” kelimesini kullanmalarının nedeni zaman içinde hareket halindeki bir 3D dünyayı simüle edebilmeleridir. Sistemin, metin açıklamalarından (diğer yapay zeka modellerindeki “istemlere” benzer şekilde) eksiksiz sanal ortamlar oluşturmak için görsel dil modellerini (VLM'ler) kullanacağı ve dünyaları oluşturmak için Genesis'in kendi simülasyon altyapısı API'lerini kullanacağı bildiriliyor.
Yapay zeka tarafından üretilen dünyaların, metin komutlarıyla gerçekçi fizik, kamera hareketleri ve nesne davranışları içereceği bildiriliyor. Sistem daha sonra fiziksel olarak doğru ışın izlemeli videolar ve robotların eğitim için kullanabileceği veriler oluşturuyor. Elbette, bunu test etmedik, bu nedenle bu iddialar şu anda bir tuz tanesi ile alınmalıdır.
Bu komut tabanlı sistem, araştırmacıların elle programlamak yerine doğal dil komutları yazarak karmaşık robot test ortamları oluşturmalarına olanak sağlayabilir. “Geleneksel olarak, simülatörler sanatçıların büyük miktarda manuel çaba göstermesini gerektirir: 3D varlıklar, dokular, sahne düzenleri vs. Ancak iş akışındaki her bileşen otomatikleştirilebilir” diye yazıyor Fan.
Genesis, motorunu kullanarak karakter hareketi, etkileşimli 3B sahneler, yüz animasyonu ve daha fazlasını da üretebilir; bu da yaratıcı projeler için sanatsal varlıkların oluşturulmasına olanak sağlayabilir, ancak gelecekte yapay zeka tarafından üretilen daha gerçekçi oyunlara ve videolara da yol açabilir, video sentezi difüzyon modelinde olduğu gibi piksellerin istatistiksel görünümü üzerinde çalışmak yerine verilerde simüle edilmiş bir dünya inşa edebilir.
Üretken sistem henüz GitHub'daki mevcut kodun bir parçası olmasa da, ekip bunu gelecekte yayınlamayı planlıyor.
Yarının robotlarını bugünden eğitmek (Python kullanarak)
Genesis, ekibin topluluk katkılarını kabul ettiği GitHub'da aktif olarak geliştirilmeye devam ediyor.
Platform, hem kullanıcı arayüzü hem de çekirdek fizik motoru için Python kullanarak robotik eğitim için diğer 3D dünya simülatörlerinden ayrılıyor. Diğer motorlar, temel hesaplamaları için C++ veya CUDA kullanırken bunları Python API'lerine sarıyor. Genesis Python öncelikli bir yaklaşım benimsiyor.
Özellikle, Genesis platformunun tescilli olmayan yapısı, yüksek hızlı robot eğitim simülasyonlarını, kullanıma hazır donanıma sahip normal bilgisayarlarda çalışan basit Python komutları aracılığıyla herhangi bir araştırmacının ücretsiz olarak kullanabilmesini sağlar.
Fan, Genesis'i duyurduğu yazısında, daha önce robot simülasyonlarını çalıştırmanın karmaşık programlama ve özel donanım gerektirdiğini ve durumun böyle olmaması gerektiğini söylüyor. “Robotik, tüm insanlığın sahipleneceği bir moonshot girişimi olmalıdır” diye yazdı.