DeepSeek Kendini ChatGPT Zannediyor

DeepSeek Kendini ChatGPT  Zannediyor

DeepSeek'in yeni yapay zeka modeli neden ChatGPT olduğunu düşünüyor?

Bu haftanın başlarında, iyi finanse edilen bir Çin yapay zeka laboratuarı olan DeepSeek, popüler kıyaslamalarda birçok rakibini geride bırakan “açık” bir yapay zeka modeli yayınladı. DeepSeek V3 adlı model büyük ama verimli, kodlama ve makale yazma gibi metin tabanlı görevleri kolaylıkla yerine getiriyor.

Ayrıca kendisinin ChatGPT olduğunu düşünüyor gibi görünüyor.

X'teki bazı gönderiler DeepSeek V3'ün kendisini OpenAI'nin yapay zeka destekli chatbot platformu ChatGPT olarak tanımladığını gösteriyor. Detaylandırması istenen DeepSeek V3, OpenAI'nin 2023'te piyasaya sürülen GPT-4 modelinin bir versiyonu olduğunda ısrar ediyor.

Sanrılar çok derin. DeepSeek V3'e DeepSeek'in API'si hakkında bir soru sorarsanız, size OpenAI'nin API'sini nasıl kullanacağınıza dair talimatlar verecektir. DeepSeek V3, GPT-4 ile aynı şakalardan bazılarını bile anlatıyor - en can alıcı noktalarına kadar.

Peki neler oluyor?

ChatGPT ve DeepSeek V3 gibi modeller istatistiksel sistemlerdir. Milyarlarca örnek üzerinde eğitildiklerinde, tahminlerde bulunmak için bu örneklerdeki kalıpları öğrenirler - bir e-postadaki “kime” ifadesinin genellikle “ilgilendirebilir” ifadesinden önce gelmesi gibi.

DeepSeek, DeepSeek V3'ün eğitim verilerinin kaynağı hakkında fazla bilgi vermedi. Ancak GPT-4 tarafından ChatGPT aracılığıyla oluşturulan metinleri içeren kamuya açık veri kümeleri konusunda bir sıkıntı yok. DeepSeek V3 bunlar üzerinde eğitildiyse, model GPT-4'ün çıktılarından bazılarını ezberlemiş ve şimdi bunları kelimesi kelimesine tekrarlıyor olabilir.

King's College London'da yapay zeka alanında uzmanlaşmış bir araştırma görevlisi olan Mike Cook TechCrunch'a verdiği demeçte, “Belli ki model bir noktada ChatGPT'den gelen ham yanıtları görüyor, ancak bunun nerede olduğu belli değil” dedi. “Bu 'tesadüfi' olabilir... ancak ne yazık ki, insanların kendi modellerini diğer modellerin çıktıları üzerinde doğrudan eğiterek onların bilgilerinden yararlanmaya çalıştıklarını gördük.”

Cook, modellerin rakip yapay zeka sistemlerinin çıktıları üzerinde eğitilmesi uygulamasının model kalitesi için “çok kötü” olabileceğini, çünkü yukarıdaki gibi halüsinasyonlara ve yanıltıcı cevaplara yol açabileceğini belirtti. Cook, “Bir fotokopinin fotokopisini çekmek gibi, giderek daha fazla bilgi ve gerçeklikle bağlantımızı kaybediyoruz” dedi.

Ayrıca bu sistemlerin hizmet şartlarına da aykırı olabilir.

OpenAI'nin şartları, ChatGPT müşterileri de dahil olmak üzere ürünlerinin kullanıcılarının, OpenAI'ninkilerle rekabet eden modeller geliştirmek için çıktıları kullanmasını yasaklıyor.

OpenAI ve DeepSeek yorum taleplerine hemen yanıt vermedi. Ancak OpenAI CEO'su Sam Altman, X Cuma günü DeepSeek ve diğer rakiplerine yönelik bir eleştiri gibi görünen bir paylaşımda bulundu.

Altman, “Çalıştığını bildiğiniz bir şeyi kopyalamak (nispeten) kolaydır,” diye yazdı. “İşe yarayıp yaramayacağını bilmediğiniz yeni, riskli ve zor bir şey yapmak son derece zordur.”

Kabul etmek gerekir ki DeepSeek V3 kendini yanlış tanımlayan ilk model olmaktan çok uzak. Google'ın Gemini'si ve diğerleri bazen rakip modeller olduklarını iddia ediyorlar. Örneğin, Mandarin dilinde söylenen Gemini, Çinli Baidu şirketinin Wenxinyiyan sohbet robotu olduğunu söylüyor.

Bunun nedeni, yapay zeka şirketlerinin eğitim verilerinin büyük kısmını temin ettikleri web'in yapay zeka çöplüğüyle dolup taşıyor olması. İçerik çiftlikleri tıklama tuzağı yaratmak için yapay zeka kullanıyor. Botlar Reddit ve X'e akın ediyor. Bir tahmine göre, 2026 yılına kadar web'in %90'ı YZ tarafından üretilmiş olabilir.

Tabiri caizse bu “kirlenme”, YZ çıktılarını eğitim veri kümelerinden tamamen filtrelemeyi oldukça zorlaştırdı.

DeepSeek'in DeepSeek V3'ü doğrudan ChatGPT tarafından oluşturulan metin üzerinde eğitmiş olması kesinlikle mümkündür. Ne de olsa Google bir zamanlar aynı şeyi yapmakla suçlanmıştı.

Kar amacı gütmeyen AI Now Enstitüsü'nün baş yapay zeka bilimcisi Heidy Khlaaf, mevcut bir modelin bilgisini “damıtarak” elde edilen maliyet tasarrufunun, riskleri ne olursa olsun geliştiriciler için cazip olabileceğini söyledi.

Khlaaf, “İnternet verileri artık yapay zeka çıktılarıyla dolup taşsa bile, yanlışlıkla ChatGPT veya GPT-4 çıktıları üzerinde eğitilecek diğer modellerin OpenAI özelleştirilmiş mesajlarını anımsatan çıktılar göstermesi gerekmeyecektir” dedi. “DeepSeek'in damıtma işlemini kısmen OpenAI modellerini kullanarak gerçekleştirmesi durumunda bu şaşırtıcı olmayacaktır.”

Ancak daha olası olan, çok sayıda ChatGPT/GPT-4 verisinin DeepSeek V3 eğitim setine girmiş olmasıdır. Bu da modelin kendi kendini tanımlamasına güvenilemeyeceği anlamına geliyor. Ancak daha endişe verici olan şey, DeepSeek V3'ün GPT-4'ün çıktılarını eleştirmeden özümseyerek ve yineleyerek modelin bazı önyargılarını ve kusurlarını daha da kötüleştirebileceği olasılığıdır.

0 Yorum
Onur Kara
Onur Kara

Elektrik-Elektronik Mühendisi

ADMİN
PROFİL

Yorum yazabilmek için ÜYE olmanız gerekiyor. Eğer ÜYE iseniz lütfen GİRİŞ yapınız.



0 Yorum

Üye Girişi

Önerilenler

En Yeniler

Öne Çıkan Videolar

Yapay Zeka Haberleri

Kuantum Bilişim Haberleri

Kategoriler

Etiketler