Gemini 2.5 tarafından selamlanıyor Google Deepmind bugüne kadar “en akıllı AI modeli” olarak.
Bu son neslin ilk modeli, DeepMind’in çok çeşitli kriterlerde son teknoloji sonuçlar elde ettiğini söylediği Gemini 2.5 Pro’nun deneysel bir versiyonudur.
Google DeepMind’in CTO’su Koray Kavukcuoglu’ya göre, Gemini 2.5 modelleri “Düşünme Modelleri”. Bu, bir yanıt üretmeden önce düşünceleri aracılığıyla akıl yürütme yeteneklerini gösterir, bu da gelişmiş performansa ve daha iyi doğruluğa yol açar.
Kavukcuoglu, “akıl yürütme” kapasitesi sadece sınıflandırma ve tahminin ötesine uzanıyor. Sistemin bilgileri analiz etme, mantıklı sonuçlar çıkarma, bağlam ve nüans dahil etme ve sonuçta bilinçli kararlar verme yeteneğini kapsar.
DeepMind, AI’nın zekasını ve akıl yürütme yeteneklerini bir süredir geliştirmek için, takviye öğrenimi ve düşünce zinciri isteme gibi teknikleri kullanma yöntemlerini araştırıyor. Bu zemin, ilk düşünme modelleri Gemini 2.0 Flash Thinking’in son tanıtımına yol açtı.
“Şimdi, Gemini 2.5 ile,” diyor Kavukcuoglu, “önemli ölçüde geliştirilmiş bir temel modeli antrenman sonrası gelişmiş ile birleştirerek yeni bir performans seviyesi elde ettik.”
Google, bu düşünme yeteneklerini doğrudan gelecekteki tüm modellerine entegre etmeyi planlıyor-daha karmaşık sorunlarla başa çıkmalarını ve daha yetenekli, bağlama duyarlı ajanları desteklemelerini sağlıyor.
İçindekiler
Gemini 2.5 Pro, Lmarena Lider Tablosu En İyi Nokta
Gemini 2.5 Pro Experimental, DeepMind’in karmaşık görevleri ele almak için en gelişmiş modeli olarak konumlandırılmıştır. Yazma olarak, insan tercihlerini değerlendirmek için anahtar bir metrik olan Lmarena liderlik tablosundaki en üst noktayı, yüksek kaliteli bir stile sahip oldukça yetenekli bir model gösteren önemli bir farkla sağlamıştır:

Gemini 2.5, matematik, bilim, kodlama ve muhakemede bir ‘profesyonel’
Gemini 2.5 Pro, ileri akıl yürütme talep eden çeşitli kriterlerde son teknoloji ürünü performans gösterdi.
Özellikle, çoğunluk oylaması gibi maliyetleri artıran test zamanı tekniklerine güvenmeden GPQA ve AIME 2025 gibi matematik ve bilim ölçütlerine yol açar. Ayrıca, bilgi ve akıl yürütmenin insan sınırını değerlendirmek için konu uzmanları tarafından tasarlanan bir veri kümesi olan Humanity’nin son sınavında% 18,8’lik bir son teknoloji puanı elde etti.
DeepMind, kodlama performansına önemli bir vurgu yaptı ve Gemini 2.5, selefi 2.0’a kıyasla, boru hattında daha fazla iyileştirme ile önemli bir sıçramayı temsil ediyor. 2.5 Pro, görsel olarak zorlayıcı web uygulamaları ve aracı kod uygulamalarının yanı sıra kod dönüşümü ve düzenleme oluşturmada mükemmeldir.
SWE-Bench doğrulandı, Ajan Kod Değerlendirmeleri için Sektör Standardı, Gemini 2.5 Pro, özel bir ajan kurulumu kullanılarak% 63.8 puan elde etti. Modelin akıl yürütme özellikleri, tek satırlık bir istemden yürütülebilir kod oluşturarak bir video oyunu oluşturmasını da sağlar.
Seleflerinin güçlü yönlerine dayanmak
Gemini 2.5, doğal multimodalite ve uzun bir bağlam penceresi de dahil olmak üzere önceki Gemini modellerinin temel güçlü yönleri üzerine kuruludur. 2.5 Pro, bir milyon jeton bağlam penceresiyle lansmanlar, bunu yakında iki milyon jetona genişletme planları. Bu, modelin geniş veri kümelerini anlamasını ve çeşitli bilgi kaynaklarından, metin, ses, görüntüler, video ve hatta kod depolarından gelen karmaşık sorunları ele almasını sağlar.
Geliştiriciler ve işletmeler artık Google AI Studio’da Gemini 2.5 Pro ile denemeye başlayabilir. İkizler Gelişmiş Kullanıcılar, masaüstü ve mobil platformlarda model açılır menü aracılığıyla da erişebilir. Model, önümüzdeki haftalarda Vertex Ai’de piyasaya sürülecek.
Google DeepMind, kullanıcıları Gemini’nin yeteneklerini daha da geliştirmek için kullanılacak geri bildirim sağlamaya teşvik eder.
(Fotoğraf Anshita Nair)
Ayrıca bakınız: Deepseek V3-0324, ilk önce açık kaynaklı olmayan AI modellerini üstlenmeyen AI modelleri

Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.