Yeni nesil ‘gerçek arayan’ AI modeli

Date:

Xai, GROK 3 AI modelini Pazartesi günü, görüntü analizi ve rafine soru cevaplama gibi yeni yeteneklerin yanı sıra tanıttı.

Şirket, GROK 3’ü geliştirmek için yaklaşık 200.000 GPU ile donatılmış muazzam bir veri merkezini kullandı. Xai sahibi Elon Musk’a göre, bu proje, öncekinden “10x” daha fazla bilgi işlem gücü kullandı ve yasal olarak bildirilen bilgiler içeren genişletilmiş bir veri kümesi ile vaka dosyaları.

Musk, Grook 3’ün “bu gerçek bazen politik olarak doğru olanla çelişmiş olsa bile, maksimum gerçek arayış yapan bir yapay zeka” olduğunu iddia etti.

GroK 3 sunumu, farklı ihtiyaçlar için tasarlanmış bir model ailesi içerir. Örneğin GroK 3 mini, mutlak doğruluktan daha hızlı tepki sürelerine öncelik verir. Bununla birlikte, özellikle dikkat çekici olan yeni akıl yürütme odaklı GROK 3 modelleri.

Grok 3 Akıl Yürütme ve GroK 3 Mini Akıl Yürütme olarak adlandırılan bu varyantlar, “düşünerek” sorunlarla insan benzeri bilişsel süreçleri taklit etmeyi amaçlamaktadır. Openai’nin O3-Mini ve Deepseek’in R1’i gibi modellerle karşılaştırılabilir, bu akıl yürütme sistemleri yanıtlarını kontrol etmeye çalışır-hatalar veya yanlış adımlar olasılığını azaltır.

GROK 3: Kıyaslama Sonuçları

Xai, GroK 3’ün, modelin matematik, fizik, biyoloji ve kimya üzerindeki karmaşık sorunlarla mücadelede yeterliliğini değerlendiren AIME ve GPQA dahil olmak üzere belirli kriterlerde Openai’nin GPT-4O’sunu aştığını ileri sürüyor.

GroK 3’ün ilk versiyonu şu anda kullanıcıların AI modellerini birbirlerine karşı çukurlaştırdıkları ve çıktılarını sıraladığı kitle kaynaklı bir değerlendirme platformu olan Chatbot Arena’ya liderlik ediyor. Model, Arena’nın 1400 skorunu ilk kıran.

Xai’ye göre, GroK 3 muhakeme rakiplerinden çeşitli önde gelen kriterlerde daha iyi performans gösteriyor:

Akıl Yürütme Benchmark Xai'den GroK 3 AI modelinin Google, Deepseek ve Openai'den diğer önde gelen yapay zeka modellerine kıyasla sonuçları.

Bu akıl yürütme modelleri zaten GROK uygulaması aracılığıyla sunulan özelliklere entegre edilmiştir. Kullanıcılar, özellikle zorlu sorularla başa çıkmak için “düşün” gibi komutları seçebilir veya daha fazla hesaplamalı yoğun “büyük beyin” modunu etkinleştirebilir.

Xai, akıl yürütme modellerini matematik, bilim ve kodlama zorlukları dahil olmak üzere STEM (bilim, teknoloji, mühendislik ve matematik) uygulamaları için ideal araçlar olarak konumlandırmıştır.

Yapay zeka damıtmasına karşı koruma

İlginç bir şekilde, GROK 3’ün tüm iç süreçleri kullanıcılara çıplak bırakılmaz. Musk, akıl yürütme modellerinin “düşüncelerinin” bazı “düşüncelerinin” damıtmayı önlemek için kasıtlı olarak gizlendiğini açıkladı – rekabet eden AI geliştiricilerinin özel modellerden bilgi çıkardığı tartışmalı bir uygulama.

Çin AI firması Deepseek’in Openai’nin modellerini en son modelini geliştirmek için damıtma iddialarıyla karşı karşıya kalmasının ardından son haftalarda uygulama, son haftalarda spot ışığına itildi.

Xai’nin yeni akıl yürütme modelleri, DeepSearch adlı yeni bir GROK uygulaması özelliğinin temeli olarak hizmet veriyor. Bu özellik, kullanıcı sorgularına cevap olarak ayrıntılı bir özeti sentezlemeden önce ilgili bilgiler için İnternet ve Musk’un sosyal platformunu X taramak için GROK modellerini kullanır.

GROK 3’e erişmek ve açık kaynak yapmayı taahhüt etmek

En son GROK modeline erişim şu anda X’in abonelik katmanlarına bağlıdır. Ayda 50 $ (~ 41 £) ödeyen Premium+ Aboneler, en son işlevlere öncelikli erişim sağlayacaktır.

Xai ayrıca ayda 30 $ veya yıllık 300 $ fiyatla fiyatlandırılan bir SuperGrok abonelik planı sunuyor. SuperGrok aboneleri gelişmiş akıl yürütme yeteneklerinden, daha derin arama sorgularından ve sınırsız görüntü oluşturma özelliklerinden yararlanacaktır.

Şirket ayrıca yaklaşan özellikleri de alay etti. Bir hafta içinde, GROK uygulamasının bir ses modu tanıtması bekleniyor – kullanıcıların AI ile etkileşime girmesini sağlayan İkizler Canlı.

Musk ayrıca, önümüzdeki haftalarda DeepSearch işlevselliği dahil olmak üzere, GROK 3 modellerini önümüzdeki haftalarda işletmeye hazır bir API aracılığıyla yayınlama planlarını açıkladı.

GroK 3 hala taze olmasına rağmen, Xai önümüzdeki aylarda selefini açık kaynaklamayı planlıyor. Musk, Xai’nin Grook’un son versiyonunu açmaya devam edeceğini iddia ediyor.

Musk, “Grok 3 olgun ve istikrarlı olduğunda, muhtemelen birkaç ay içinde, o zaman açık kaynaklı GroK 2’yi açıklayacağız” diye açıklıyor Musk.

‘Uyaran Karşıtı’ AI modeli

GroK uzun zamandır filtrelenmemiş, cesur ve rakiplerin kaçınabileceği sorgularla etkileşime girmeye istekli olarak pazarlanıyor. Musk daha önce AI’yı “uyanık anti” olarak nitelendirerek, tartışmalı konulara değinmekten korkmayan bir model olarak sunuldu.

Sözüne göre, Grook ve GroK 2 gibi erken modeller siyasi olarak yüklü sorguları benimsedi, hatta istendiğinde renkli bir dile dönüştü. Yine de, bu versiyonlar siyasi söylemin derinliklerine girerken bazı önyargılar ortaya koydu.

Musk, “GroK’ı siyasi açıdan nötral hale getirmek için çalışıyoruz” dedi.

Ancak, GROK 3’ün bu hedefe ulaşıp ulaşmadığı görülüyor. Oyundaki bu tür değişikliklerle analistler, giderek daha fazla “hakikat arayan” ancak politik olarak duyarlı AI sistemlerini sunmanın potansiyel toplumsal etkilerini zaten vurgulamaktadır.

GroK 3 ile Musk ve Xai, önyargı, şeffaflık ve AI dağıtımının etiği etrafında tartışmaları desteklerken teknolojilerini ileriye doğru iterek cesur bir açıklama yaptı.

Openai, Google ve Deepseek gibi rakipler tekliflerini geliştirirken, GroK 3’ün başarısı doğruluğu, kullanıcı talebini ve toplumsal sorumluluğu dengeleme yeteneğine bağlı olacaktır.

Ayrıca bakınız: 2025’te AI: Amaç odaklı modeller, insan entegrasyonu ve daha fazlası

Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon KonferansıBlockx Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related