xAI’nin sahip olduğu duyuruldu Sohbet, kodlama ve muhakeme konularında geliştirilmiş yeteneklere sahip büyük bir yükseltme olan Grok-2’nin piyasaya sürülmesi.
xAI, Grok-2’nin yanı sıra ana modelin daha küçük ama yetenekli bir versiyonu olan Grok-2 mini’yi de tanıttı. Her ikisi de şu anda X’te beta aşamasındadır ve bu ayın sonlarında xAI’nin kurumsal API’si aracılığıyla kullanıma sunulacaktır.
Grok-2’nin erken bir versiyonu test edildi LMSYS liderlik tablosu “sus-column-r” takma adı altında.
Duyuru sırasında xAI, hem Anthropic’in Claude 3.5 Sonnet’inden hem de OpenAI’nin GPT-4-Turbo’sundan daha iyi performans gösterdiğini iddia ediyordu. Bununla birlikte, GPT-4o’nun şu anda genel yetenekler açısından en iyi yapay zeka asistanı olarak en üst sırada yer aldığını ve onu Google’ın Gemini 1.5’inin takip ettiğini belirtmekte fayda var.
xAI’nin dahili değerlendirme süreci, modelleri çeşitli gerçek dünya görevlerinde değerlendirmek için Yapay Zeka Eğitmenlerini kullanır. Şirket, “Grok-2’nin, alınan içerikle akıl yürütmede ve eksik bilgileri doğru şekilde tanımlama, olay dizileri üzerinden akıl yürütme ve alakasız gönderileri atma gibi araç kullanım yeteneklerinde önemli gelişmeler gösterdiğini” belirtiyor.
xAI tarafından paylaşılan kıyaslama sonuçları, hem Grok-2 hem de Grok-2 mini’nin Grok-1.5’e göre önemli gelişmeler gösterdiğini gösteriyor. Modeller, lisansüstü düzeyde fen bilgisi, genel bilgi ve matematik rekabet problemleri gibi alanlarda rekabetçi performans göstermektedir. Özellikle Grok-2, görsel matematik muhakemesi ve belge tabanlı soru yanıtlamada en son teknoloji performansı sunarak vizyona dayalı görevlerde üstünlük sağlıyor.
Yeni Grok deneyimi X yeniden tasarlanmış bir arayüze ve yeni özelliklere sahiptir. Premium ve Premium+ aboneleri hem Grok-2 hem de Grok-2 mini’ye erişebilecek. xAI, Grok-2’yi “ister yanıt arıyor olun, ister yazma konusunda işbirliği yapın, ister kodlama görevlerini çözün, çok çeşitli görevlerde daha sezgisel, yönlendirilebilir ve çok yönlü” olarak tanımlıyor.
xAI ayrıca aşağıdakilerle işbirliği yapıyor: Kara Orman Laboratuvarları Grok’un X üzerindeki yeteneklerini genişletmek için FLUX.1 modeliyle denemeler yapacak.
xAI, geliştiriciler için bu ayın sonlarında kurumsal bir API platformu başlatacak. Şirket, gelişmiş güvenlik özellikleri, zengin trafik istatistikleri ve gelişmiş faturalandırma analitiği vaat ediyor. Ekip, kullanıcı ve fatura yönetimini mevcut araç ve hizmetlere entegre etmek için bir yönetim API’si de mevcut olacak.
Geleceğe baktığımızda xAI, hem X’te hem de API’de Grok deneyiminin temel bir parçası olarak multimodal anlayışı sunmayı planlıyor. Şirketin Kasım 2023’te Grok-1’i duyurduğu günden bu yana hızlı ilerlemesi, “en yüksek yetenek yoğunluğuna sahip küçük bir ekibe” bağlanıyor.
xAI’nin odak noktası, yeni bilgi işlem kümesiyle temel muhakeme yeteneklerini geliştirmeye devam ediyor ve AI gelişiminde ön sıradaki konumunu korumayı hedefliyor. Ancak şirket yakın zamanda modellerinin eğitimi için belirli AB verilerinin kullanımını durdurmayı kabul etti.
Grok-2’nin piyasaya sürülmesi xAI için önemli bir dönüm noktasına işaret ederken, yapay zeka ortamının oldukça rekabetçi olmaya devam ettiği açıktır. ChatGPT-4o ve Google’ın Gemini 1.5’inin lider olması ve Anthropic gibi diğer büyük oyuncuların ilerleme kaydetmeye devam etmesiyle, yapay zeka üstünlüğü yarışı henüz bitmedi.
Ayrıca bakınız: SingularityNET, AGI sunmak için süper bilgisayar ağına güveniyor
Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: Akıllı Otomasyon Konferansı, BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.