GPT-4.1: Daha İyi Kod, Daha Fazla Hız, Daha Az Bekleme
- YAPAY ZEKA
- 15:13, May 17
Google CEO'su Sundar Pichai, Google'ın yapay zekâda devrim yaratma hedefinde bir sonraki adımı temsil eden Gemini 2.0 modelinin lansmanını duyurdu.
Gemini 1.0 modelinin tanıtılmasından bir yıl sonra, bu büyük yükseltme, gelişmiş multimodal yetenekleri, ajan işlevselliğini ve yapay zeka odaklı teknolojide sınırları zorlamak için tasarlanmış yenilikçi kullanıcı araçlarını içeriyor.
Dönüşümsel yapay zekaya doğru sıçrama
Google'ın dünyadaki bilgileri düzenleme ve erişilebilir hale getirme konusundaki 26 yıllık misyonunu değerlendiren Pichai, “Gemini 1.0 bilgiyi düzenlemek ve anlamakla ilgiliyse, Gemini 2.0 da onu çok daha kullanışlı hale getirmekle ilgilidir” dedi.
Aralık 2022'de yayınlanan Gemini 1.0, Google'ın ilk yerel olarak çok modlu yapay zeka modeli olmasıyla dikkat çekiyordu. İlk iterasyon metin, video, görüntü, ses ve kodu anlama ve işleme konusunda mükemmeldi. Geliştirilmiş 1.5 sürümü, üretkenlik odaklı NotebookLM gibi uygulamalara olanak tanıyan uzun bağlamlı anlayışıyla geliştiriciler tarafından yaygın olarak benimsendi.
Şimdi, Gemini 2.0 ile Google, yapay zekanın doğal görüntü ve ses oluşturma, daha iyi muhakeme ve planlama ve gerçek dünyada karar verme yeteneklerine sahip evrensel bir asistan olarak rolünü hızlandırmayı hedefliyor. Pichai'nin sözleriyle, bu gelişme “ajan çağının” başlangıcını temsil ediyor.
Pichai, “Daha agentic modeller geliştirmeye yatırım yapıyoruz, yani etrafınızdaki dünya hakkında daha fazla şey anlayabilir, birden fazla adım ilerisini düşünebilir ve sizin gözetiminizde sizin adınıza harekete geçebilirler” dedi.
Gemini 2.0: Temel özellikler ve kullanılabilirlik
Bugünkü duyurunun merkezinde, Gemini'nin ikinci neslinin amiral gemisi modeli olan Gemini 2.0 Flash'ın deneysel sürümü yer alıyor. Bu model, daha hızlı tepki süreleri ve gelişmiş performans sunarken kendinden önceki modellerin attığı temeller üzerine inşa edilmiştir.
Gemini 2.0 Flash, metinle birlikte yerel görüntüler oluşturma ve yönlendirilebilir metinden konuşmaya çok dilli ses üretme yeteneği de dahil olmak üzere çok modlu giriş ve çıkışları destekler. Ayrıca, kullanıcılar Google Arama gibi yerel araç entegrasyonundan ve hatta üçüncü taraf kullanıcı tanımlı işlevlerden yararlanabilirler.
Geliştiriciler ve işletmeler, Google AI Studio ve Vertex AI'daki Gemini API aracılığıyla Gemini 2.0 Flash'a erişebilirken, daha büyük model boyutlarının Ocak 2024'te daha geniş bir şekilde piyasaya sürülmesi planlanıyor.
Küresel erişilebilirlik için Gemini uygulaması artık 2.0 Flash deneysel modelinin sohbet için optimize edilmiş bir versiyonunu içeriyor. Erken benimseyenler bu güncellenmiş asistanı masaüstü ve mobil cihazlarda deneyimleyebilir, mobil uygulama da yakında kullanıma sunulacak.
Google Arama gibi ürünler de Gemini 2.0 ile geliştirilerek ileri matematik problemleri, kodlama soruları ve çok modlu sorular gibi karmaşık sorguların üstesinden gelme yeteneğini ortaya çıkarıyor.
Kapsamlı yapay zeka inovasyonları paketi
Gemini 2.0'ın lansmanı, yeteneklerini sergileyen ilgi çekici yeni araçlarla birlikte geliyor.
Bu özelliklerden biri olan Derin Araştırma, bir yapay zeka araştırma asistanı olarak işlev görüyor ve bilgileri kapsamlı raporlar halinde derleyerek karmaşık konuların araştırılması sürecini basitleştiriyor. Bir diğer yükseltme ise karmaşık, çok adımlı kullanıcı sorgularının üstesinden gelen Gemini özellikli Yapay Zeka Genel Bakışları ile Arama'yı geliştiriyor.
Model, Pichai'nin “Gemini 2.0 eğitiminin ve çıkarımının %100'ünü desteklediğini” belirttiği Trillium olarak bilinen Google'ın altıncı nesil Tensör İşleme Birimleri (TPU'lar) kullanılarak eğitildi.
Trillium artık harici geliştiriciler tarafından da kullanılabiliyor ve Google'ın kendi geliştirmelerini destekleyen aynı altyapıdan faydalanmalarına olanak tanıyor.
Öncü ajan deneyimleri
Gemini 2.0'a eşlik eden deneysel “ajan” prototipler, insan-yapay zeka işbirliğinin geleceğini keşfetmek için tasarlandı:
Astra Projesi: Evrensel bir yapay zeka asistanı
İlk olarak bu yılın başlarında I/O'da tanıtılan Project Astra, gerçek dünyadaki yapay zeka etkileşimlerini iyileştirmek için Gemini 2.0'ın çok modlu anlayışından yararlanıyor. Güvenilir test kullanıcıları asistanı Android'de denedi ve çok dilli diyaloğunu, hafızada tutma özelliğini ve Arama, Lens ve Haritalar gibi Google araçlarıyla entegrasyonunu geliştirmeye yardımcı olan geri bildirimler sundu. Astra ayrıca, prototip yapay zeka gözlükleri gibi giyilebilir teknolojilerde uygulanması için daha fazla araştırmanın devam ettiği, insana yakın konuşma gecikmesini de göstermiştir.
Project Mariner: Web otomasyonu yeniden tanımlanıyor
Project Mariner, Gemini 2.0'ın metin, resim ve tarayıcı içindeki formlar gibi etkileşimli öğeler arasında mantık yürütme yeteneğini kullanan deneysel bir web tarama asistanıdır. İlk testlerde, uçtan uca web görevlerini tamamlamak için WebVoyager ölçütünde %83,5'lik bir başarı oranı elde etti. Bir Chrome uzantısı kullanan ilk test kullanıcıları Mariner'ın yeteneklerinin geliştirilmesine yardımcı olurken Google da teknolojinin kullanıcı dostu ve güvenli kalmasını sağlayacak güvenlik önlemlerini değerlendiriyor.
Jules: Geliştiriciler için bir kodlama aracı
Geliştiriciler için tasarlanmış yapay zeka destekli bir asistan olan Jules, kodlama zorluklarını ele almak için doğrudan GitHub iş akışlarına entegre oluyor. Otonom olarak çözümler önerebiliyor, planlar oluşturabiliyor ve kod tabanlı görevleri yerine getirebiliyor; üstelik bunların hepsi insan gözetimi altında gerçekleştiriliyor. Bu deneysel çalışma, Google'ın çeşitli alanlarda çok yönlü yapay zeka ajanları yaratmaya yönelik uzun vadeli hedefinin bir parçasıdır.
Oyun uygulamaları ve ötesi
Gemini 2.0'ın erişim alanını sanal ortamlara genişleten Google DeepMind, Supercell gibi oyun ortaklarıyla akıllı oyun aracıları üzerinde çalışıyor. Bu deneysel yapay zeka arkadaşları, oyun eylemlerini gerçek zamanlı olarak yorumlayabilir, stratejiler önerebilir ve hatta Arama yoluyla daha geniş bilgiye erişebilir. Gemini 2.0'ın uzamsal muhakemesinin robotları nasıl destekleyebileceği ve gelecekte fiziksel dünya uygulamaları için nasıl kapılar açabileceği konusunda da araştırmalar yürütülüyor.
Yapay zeka geliştirmede sorumluluğun ele alınması
Yapay zeka yetenekleri arttıkça, Google güvenlik ve etik hususlara öncelik vermenin önemini vurguluyor.
Google, Gemini 2.0'ın kapsamlı risk değerlendirmelerinden geçtiğini ve olası riskleri azaltmak için Sorumluluk ve Güvenlik Komitesi'nin gözetimiyle desteklendiğini iddia ediyor. Buna ek olarak, yerleşik muhakeme yetenekleri, geliştiricilerin güvenlik senaryolarını değerlendirmesine ve güvenlik önlemlerini geniş ölçekte optimize etmesine olanak tanıyan gelişmiş “kırmızı ekip” sağlar.
Google ayrıca kullanıcı gizliliğini ele almak, kötüye kullanımı önlemek ve yapay zeka aracılarının güvenilir kalmasını sağlamak için önlemler araştırıyor. Örneğin Project Mariner, kötü niyetli istem enjeksiyonlarına karşı koyarken kullanıcı talimatlarına öncelik verecek ve kimlik avı veya hileli işlemler gibi tehditleri önleyecek şekilde tasarlanmıştır. Bu arada, Project Astra'daki gizlilik kontrolleri, kullanıcıların oturum verilerini ve silme tercihlerini yönetmelerini kolaylaştırıyor.
Pichai, şirketin sorumlu geliştirme konusundaki kararlılığını bir kez daha teyit ederek, “Yapay zeka oluşturmanın tek yolunun en başından itibaren sorumlu olmak olduğuna inanıyoruz” dedi.
Gemini 2.0 Flash sürümüyle birlikte Google, farklı alanlardaki etkileşimleri dönüştürebilecek evrensel bir asistan oluşturma vizyonuna daha da yaklaşıyor.