Optik Yapay Zeka ile Matematiği İşlemek

Yapay Zeka
17:55, Oca 22
Arda Kara
399 Okunma
0 Yorum

MIT'deki araştırmacılar tarafından inşa edilen bir optik işlemci.

Doğrusal olmayan matematiği işlemek için tamamen optik bir yapay zeka elde etmek.

Fotonları algılamak ve sonuçları işlemek yerine, neden fotonları işlemeyelim?

Bir arabada acil frenleme gibi işlemler için kullanılan standart bir dijital kameranın algısal gecikme süresi 20 milisaniyenin biraz üzerindedir. Bu sadece bir kameranın CMOS ya da CCD sensörleri kullanarak açıklığına çarpan fotonları elektrik yüklerine dönüştürmesi için gereken süredir. Bu bilgiyi yerleşik bir bilgisayara göndermek ya da orada işlemek için gereken diğer milisaniyeleri saymaz.

MIT araştırmacılarından oluşan bir ekip, fotonları doğrudan işleyebilen bir çipiniz olsaydı, tüm sayısallaştırma adımını atlayıp hesaplamaları fotonların kendisiyle yapabileceğinizi ve bunun akıl almaz derecede daha hızlı olma potansiyeline sahip olduğunu düşündü.

“Burada çok spesifik bir ölçüt olan gecikme süresine odaklanıyoruz. En önemli şeyin bir çözümü ne kadar hızlı üretebildiğiniz olduğu uygulamaları hedefliyoruz. Bu yüzden tüm hesaplamaları optik olarak yapabildiğimiz sistemlerle ilgileniyoruz” diyor MIT araştırmacısı Saumil Bandyopadhyay. Ekip, fotonik bir çip üzerinde eksiksiz bir derin sinir ağı uygulayarak 410 pikosaniyelik bir gecikme süresi elde etti. Bunu bir perspektife oturtmak gerekirse, Bandyopadhyay'ın çipi, standart bir CPU'nun 4 GHz'lik saatinin tek bir tıklamasıyla, sahip olduğu tüm sinir ağını yaklaşık 58 kez işleyebildi.

Matrisler ve doğrusal olmama

Sinir ağları, nöronlar olarak işlev gören çok sayıda hesaplama birimi katmanıyla çalışır. Bandyopadhyay, “Her nöron bir girdi alabilir ve bu girdiler, diyelim ki sayılar olabilir” diyor. Bu sayılar daha sonra ağırlık adı verilen bir sabit ya da bir parametre ile çarpılarak bir sonraki nöron katmanına aktarılıyor. Her katman, önceki katmanların ağırlıklı bir toplamını alır ve ileri doğru gönderir.

Bu, matris çarpımı gerçekleştiren doğrusal cebire eşdeğerdir. Bununla birlikte, yapay zeka modelleri genellikle çıktının her zaman girdiyle orantılı olmadığı verilerdeki karmaşık kalıpları bulmak için kullanılır. Bunun için nöron katmanları arasındaki ağırlıkları ayarlayan doğrusal olmayan eşikleme işlevlerine de ihtiyacınız vardır. Bandyopadhyay, “Derin sinir ağlarını bu kadar güçlü kılan şey, hem bu doğrusal işlemleri hem de doğrusal olmayan eşikleme işlevlerini katmanlar arasında tekrar tekrar basamaklandırarak verilerdeki çok karmaşık ilişkileri haritalandırabilmemizdir” diyor.

Sorun şu ki, bu basamaklandırma standart bilgisayarlarda yapıldığında tonlarca enerji ve zaman alan devasa paralel hesaplamalar gerektiriyor. Bandyopadhyay'ın ekibi bu sorunun, eşdeğer işlemleri elektronlar yerine fotonlar kullanarak gerçekleştirerek çözülebileceğini düşünüyor. Fotonik çiplerde bilgi polarizasyon, faz, büyüklük, frekans ve dalga vektörü gibi optik özelliklerle kodlanabilir. Bu son derece hızlı ve enerji tasarruflu olsa da, bu tür çipleri oluşturmak kolay değil.

Sifonlama ışığı

Bandyopadhyay, “Uygun bir şekilde, fotoniklerin doğrusal matris işlemlerinde özellikle iyi olduğu ortaya çıktı” diyor. Bandyopadhyay'ın çalışmasının ortak yazarlarından biri olan profesör Dirk Englund liderliğindeki MIT'deki bir grup, 2017 yılında tamamen ışıkla matris çarpımı yapan fotonik bir çip gösterdi. Ancak bu alanın zorlandığı konu, fotonikte doğrusal olmayan işlevlerin uygulanmasıydı.

Şimdiye kadarki olağan çözüm, fotonik çiplerde doğrusal cebir yaparak ve doğrusal olmayan işlemleri harici elektroniklere yükleyerek sorunu atlatmaya dayanıyordu. Ancak bu, bilginin ışıktan elektrik sinyallerine dönüştürülmesi, harici bir işlemcide işlenmesi ve tekrar ışığa dönüştürülmesi gerektiğinden gecikme süresini artırıyordu. Bandyopadhyay, “Fotonikte sinir ağları inşa etmek istememizin başlıca nedeni de gecikme süresini azaltmak” diyor.

Bu sorunu çözmek için Bandyopadhyay ve meslektaşları, fotonları kullanarak hem doğrusal hem de doğrusal olmayan işlemler de dahil olmak üzere tüm derin sinir ağını hesaplayabilen muhtemelen dünyanın ilk çipini tasarladı ve inşa etti. “Süreç, ışığı bir optik fiber aracılığıyla çipe besleyen bir modülatöre sahip harici bir lazerle başlıyor. Bu şekilde elektrik girdilerini ışığa dönüştürüyoruz” diye açıklıyor Bandyopadhyay.

Işık daha sonra altı kanala yayılıyor ve Mach-Zehnder interferometreleri adı verilen bir dizi cihaz kullanılarak doğrusal matris çarpımı gerçekleştiren altı nörondan oluşan bir katmana besleniyor. “Bunlar esasen programlanabilir ışın ayırıcılardır, iki optik alan alır ve iki çıkış optik alanı üretmek için bunları tutarlı bir şekilde karıştırır. Voltaj uygulayarak iki girdinin ne kadar karışacağını kontrol edebilirsiniz,” diyor Bandyopadhyay.

Bu bağlamda tek bir Mach-Zehnder interferometresinin yaptığı şey, bir çift optik sinyal üzerinde gerçekleştirilen ikiye iki matris işlemidir. Ekip, bu interferometrelerden oluşan dikdörtgen bir dizi ile altı optik kanalın tamamında daha büyük bir matris işlemi gerçekleştirebilir.

İlk katmanda matris çarpımı yapıldıktan sonra, bilgi doğrusal olmayan eşiklemeden sorumlu bir birim aracılığıyla başka bir katmana gider. Bandyopadhyay, “Bunu elektronik ve optiği birlikte entegre ederek yaptık” diyor. Bu işlem, optik sinyalin küçük bir parçasını, orada ne kadar optik güç olduğunu ölçen bir fotodiyoda göndererek çalışıyor. Bu ölçümün sonucu, cihazdan geçen fotonların geri kalanını manipüle etmek için kullanılıyor. Bandyopadhyay, “Optik sinyalin geri kalanını modüle etmek için diyota sifonlanan o küçük optik sinyal parçasını kullanıyoruz” diye açıklıyor.

Çipin tamamında matris çarpımı yapan üç nöron katmanı ve arada iki doğrusal olmayan fonksiyon birimi vardı. Genel olarak, çip üzerinde uygulanan ağ 132 parametre ile çalışabiliyordu.

Bu, bir bakıma, optik çiplerin günümüzde sahip olduğu bazı sınırlamaların altını çiziyor. Chat GPT-4 büyük dil modelinde kullanılan parametre sayısının 1 trilyon olduğu bildiriliyor. Bu trilyonla karşılaştırıldığında, Bandyopadhyay'ın çipi tarafından desteklenen 132 parametre... daha az gibi görünüyordu.

Mütevazı başlangıçlar

“Büyük dil modelleri temelde sahip olabileceğiniz en büyük modellerdir, değil mi? Üstesinden gelinmesi en zor olanlardır. Biz daha çok daha düşük gecikme süresinden yararlandığınız uygulamalara odaklanıyoruz ve bu tür modeller daha küçük oluyor” diyor Bandyopadhyay. Ekibi, çipini 100.000'e kadar parametreyle çalışan yapay zekalara güç vermeye yönlendiriyor. “Ticari açıdan faydalı bir şey yapmak için doğrudan Chat GPT'ye gitmek zorunda değiliz. Önce bu küçük modelleri hedefleyebiliriz,” diye ekliyor Bandyopadhyay.

Bandyopadhyay'ın çalışmasında çip üzerinde uyguladığı daha küçük model, yapay zeka odaklı donanım araştırmalarında yaygın olarak ölçüt olarak kullanılan bir görev olan sesli harfleri tanıdı. Yüzde 92 doğruluk oranıyla standart bilgisayarlarda çalışan nöral ağlarla aynı seviyeye ulaştı.

Ancak küçük modellerin yapabileceği başka ve çok daha havalı şeyler de var. Bunlardan biri de sürücüsüz araçların kaza yapmasını önlemek. Bandyopadhyay, “Buradaki fikir, lidar sinyallerini çok hızlı gecikmeyle, insan reflekslerinden çok daha hızlı bir şekilde tekrar tekrar sınıflandırmak istediğiniz otonom bir navigasyon sistemine sahip olmanızdır” diyor. Ekibine göre, üzerinde çalıştıkları gibi çipler, fotonları elektrik sinyallerine dönüştürmeden doğrudan fotonik çiplere iterek lidar verilerini doğrudan sınıflandırmayı mümkün kılmalıdır.

Bandyopadhyay'ın fotonik çiplerle desteklenebileceğini düşündüğü diğer şeyler ise bugün kullandığımız kamera tabanlı sistemlerden tamamen farklı olan otomotiv görüş sistemleri. “Esasen bildiğimiz kamerayı değiştirebilirsiniz. Bunun yerine optik sinyalleri alan, örnekleyen ve bunları makine öğrenimi hesaplamaları için doğrudan optik işlemcilere gönderen geniş bir dizi girişe sahip olabilirsiniz” diyor Bandyopadhyay. “Bu sadece bir sistem mühendisliği meselesi.”

Ekip çipi, Bandyopadhyay'in ölçeklendirmeyi kolaylaştıracağını söylediği standart CMOS süreçlerini kullanarak inşa etti. “Tek bir çipe sığabileceklerle sınırlı değilsiniz. Daha büyük ağlar gerçekleştirmek için çok çipli sistemler yapabilirsiniz. Bu, fotonik çip teknolojisi için umut verici bir yön - elektronikte bunun gerçekleştiğini zaten görebilirsiniz” diyor Bandyopadhyay.

0 Yorum