Alibaba’nın Deepseek’e verdiği yanıtı, şirketin en son Experts karışımı (MOE) büyük ölçekli model olan Qwen 2.5-Max.
Qwen 2.5-Max, 20 trilyonun üzerinde jeton üzerinde önleme ve denetimli ince ayar (SFT) ve insan geri bildiriminden (RLHF) takviye öğrenimi gibi en son teknikler aracılığıyla ince ayar yapıyor.
API şimdi mevcut Alibaba bulutu Ve Qwen Chat aracılığıyla keşif için erişilebilen model olan Çin teknoloji devi, geliştiricileri ve araştırmacıları atılımlarını ilk elden görmeye davet ediyor.
Daha iyi akranlar
Qwen 2.5-Max’in performansını çeşitli kriterlerde en önemli AI modellerinden bazılarıyla karşılaştırırken, sonuçlar umut vericidir.
Değerlendirmeler, üniversite düzeyinde problem çözme için MMLU-Pro, kodlama uzmanlığı için LiveCodebench, genel yetenekler için Livebench ve insan tercihlerine karşı modelleri değerlendirmek için arena zorlayıcıları içeriyordu.
Alibaba’ya göre, “Qwen 2.5-Max, Arena-Hard, Livebench, LiveCodebench ve GPQA-Diamond gibi ölçütlerde Deepseek V3’ten daha iyi performans gösterirken, aynı zamanda MMLU-Pro dahil diğer değerlendirmelerde rekabetçi sonuçlar sergiliyor.”
Sohbet ve kodlama gibi aşağı akış görevleri için tasarlanmış talimat modeli, doğrudan GPT-4O, Claude-3.5-Sonnet ve Deepseek V3 gibi önde gelen modellerle rekabet eder. Bunlar arasında Qwen 2.5-Max, çeşitli kilit alanlarda rakiplerden daha iyi performans göstermeyi başardı.
Temel modellerin karşılaştırılması da umut verici sonuçlar vermiştir. GPT-4O ve CLAUDE-3.5-SONNET gibi tescilli modeller erişim kısıtlamaları nedeniyle ulaşılamayacak şekilde kalırken, Qwen 2.5-Max, Deepseek V3, Lama-3.1-405b (en büyük açık ağırlıklı yoğun model gibi önde gelen kamu seçeneklerine karşı değerlendirildi. ) ve qwen2.5-72b. Yine, Alibaba’nın yeni gelenleri tahtada olağanüstü bir performans sergiledi.
Alibaba, “Temel modellerimiz çoğu ölçütte önemli avantajlar gösterdi,” dedi.
Qwen 2.5-Max’in erişilebilir hale getirilmesi
Modeli küresel topluluk için daha erişilebilir hale getirmek için Alibaba, QWEN 2.5-Max’i QWEN sohbet platformuyla entegre etti, burada kullanıcılar, arama yeteneklerini araştırıyor veya karmaşık sorgular anlayışını test ediyor olsun, modelle doğrudan modelle etkileşime girebilir.
Geliştiriciler için Qwen 2.5-Max API artık Alibaba Cloud aracılığıyla “Qwen-MAX-2025-01-25” model adı altında kullanılabilir. İlgilenen kullanıcılar bir Alibaba bulut hesabı kaydederek, model stüdyo hizmetini etkinleştirerek ve bir API anahtarı oluşturarak başlayabilir.
API, Openai’nin ekosistemiyle bile uyumludur ve entegrasyonu mevcut projeler ve iş akışları için basit hale getirir. Bu uyumluluk, uygulamalarını modelin yetenekleriyle test etmeye istekli olanların bariyerini düşürür.
Alibaba, Qwen 2.5-Max ile güçlü bir niyet ifadesi yaptı. Şirketin AI modellerini ölçeklendirme konusundaki taahhüdü, sadece performans kriterlerini iyileştirmek değil, aynı zamanda bu sistemlerin temel düşünme ve akıl yürütme yeteneklerini geliştirmekle ilgilidir.
Alibaba, “Verilerin ve model boyutunun ölçeklendirilmesi sadece model istihbaratındaki gelişmeleri sergilemekle kalmaz, aynı zamanda öncü araştırmalara karşı değişmez bağlılığımızı da yansıtıyor” dedi.
İleriye baktığımızda, ekip daha da ileri akıl yürütme becerilerini geliştirmek için takviye öğrenim sınırlarını zorlamayı amaçlıyor. Bu, modellerinin sadece karmaşık problemleri çözmede insan zekasını da eşleştirmekle kalmayıp da aşabileceğini söylüyorlar.
Endüstri için çıkarımlar derin olabilir. Ölçeklendirme yöntemleri geliştikçe ve Qwen modelleri yeni bir zemini kırdıkça, son haftalarda gördüğümüz küresel olarak AI güdümlü alanlarda daha fazla dalgalanma göreceğiz.
(Fotoğraf Maico Amorim)
Ayrıca bakınız: Chatgpt Gov, ABD devlet kurumlarını modernize etmeyi hedefliyor
Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.