Mistral AI’nin son modeli, Mistral Büyük 2 (ML2), boyutlarının çok küçük olmasına rağmen OpenAI, Meta ve Anthropic gibi endüstri liderlerinin büyük modelleriyle rekabet ettiği iddia ediliyor.
Bu sürümün zamanlaması dikkate değer; Meta’nın devasa 405 milyar parametreli Llama 3.1 modelini piyasaya sürmesiyle aynı haftaya ulaşması. Hem ML2 hem de Llama 3, gelişmiş “bellek” için 128.000 jetonluk bağlam penceresi ve birden fazla dil desteği dahil olmak üzere etkileyici yeteneklere sahiptir.
Mistral AI uzun süredir dil çeşitliliğine odaklanarak kendisini farklılaştırıyor ve ML2 bu geleneği sürdürüyor. Model, “düzinelerce” dili ve 80’den fazla kodlama dilini destekliyor ve bu da onu dünya çapındaki geliştiriciler ve işletmeler için çok yönlü bir araç haline getiriyor.
Mistral’ın kriterlerine göre ML2, çeşitli dil, kodlama ve matematik testlerinde OpenAI’nin GPT-4o, Anthropic’in Claude 3.5 Sonnet’i ve Meta’nın Llama 3.1 405B’si gibi üst düzey modellere karşı rekabetçi bir performans sergiliyor.
Yaygın olarak tanınan Massive Multitask Language Understanding (MMLU) değerlendirmesinde ML2 yüzde 84’lük bir puan elde etti. Rakiplerinin biraz gerisinde olmasına rağmen (%88,7 ile GPT-4o, %88,3 ile Claude 3.5 Sonnet ve %88,6 ile Llama 3.1 405B), insan alanı uzmanlarının bu testte %89,8 civarında puan alacağının tahmin edildiğini belirtmekte fayda var.
İçindekiler
Verimlilik: Önemli bir avantaj
ML2’yi diğerlerinden ayıran şey, rakiplerinden önemli ölçüde daha az kaynakla yüksek performans elde edebilme yeteneğidir. 123 milyar parametreyle ML2, Meta’nın en büyük modelinin üçte birinden daha küçük ve GPT-4’ün yaklaşık on dörtte biri boyutundadır. Bu verimliliğin dağıtım ve ticari uygulamalar üzerinde önemli etkileri vardır.
Tam 16 bit hassasiyette ML2, yaklaşık 246 GB bellek gerektirir. Bu, tek bir GPU için hala çok büyük olsa da, dört ila sekiz GPU’lu bir sunucuya, nicelemeye başvurmadan kolayca dağıtılabilir; bu, GPT-4 veya Llama 3.1 405B gibi daha büyük modellerle mutlaka başarılması mümkün olmayan bir başarıdır.
Mistral, LLM performansının büyük ölçüde bellek bant genişliği tarafından belirlendiğinden, ML2’nin daha küçük ayak izinin daha yüksek verime dönüştüğünü vurguluyor. Pratik anlamda bu, ML2’nin aynı donanımdaki daha büyük modellere göre daha hızlı yanıt üretebileceği anlamına gelir.
Temel zorlukların üstesinden gelmek
Mistral, yapay zeka modellerinin ikna edici ancak yanlış bilgiler ürettiği yaygın bir sorun olan halüsinasyonlarla mücadeleye öncelik verdi. Şirket, ML2’nin yanıtlarında daha “temkinli ve anlayışlı” olacak ve bir soruyu yanıtlamak için yeterli bilgiye sahip olmadığı zamanları daha iyi anlayacak şekilde ince ayar yapıldığını iddia ediyor.
Ek olarak ML2, özellikle uzun konuşmalarda karmaşık talimatları takip etmekte başarılı olacak şekilde tasarlanmıştır. İstemi takip etme yeteneklerindeki bu gelişme, modeli çeşitli uygulamalarda daha çok yönlü ve kullanıcı dostu hale getirebilir.
Mistral, pratik iş kaygılarına bir selam olarak, uygun olduğunda kısa ve öz yanıtlar üretmek için ML2’yi optimize etti. Ayrıntılı çıktılar daha yüksek kıyaslama puanlarına yol açsa da genellikle hesaplama süresinin ve operasyonel maliyetlerin artmasına neden olur; bu da ML2’yi ticari kullanım için daha çekici hale getirebilir.
Önceki Mistral Large ile karşılaştırıldığında hizalama ve talimat yeteneklerine çok daha fazla çaba harcandı. WildBench, ArenaHard ve MT Bench’te en iyi modellerle aynı performansı gösterirken çok daha az ayrıntılıdır. (4/N) pic.twitter.com/fvPOqfLZSq
— Guillaume Lample @ ICLR 2024 (@GuillaumeLample) 24 Temmuz 2024
Lisanslama ve kullanılabilirlik
ML2, aşağıdaki gibi popüler depolarda ücretsiz olarak mevcuttur: Sarılma Yüzlisans koşulları Mistral’in önceki tekliflerinden bazılarına göre daha kısıtlayıcıdır.
Mistral-NeMo-12B modeli için kullanılan açık kaynaklı Apache 2 lisansının aksine, ML2, Mistral Araştırma Lisansı. Bu, ticari olmayan ve araştırma amaçlı kullanıma izin verir ancak iş uygulamaları için ayrı bir ticari lisans gerektirir.
Yapay zeka yarışı kızışırken Mistral’ın ML2’si güç, verimlilik ve pratikliğin dengelenmesinde önemli bir ileri adımı temsil ediyor. Teknoloji devlerinin hakimiyetine gerçekten meydan okuyabilecek mi, henüz bilinmiyor, ancak piyasaya sürülmesi kesinlikle büyük dil modelleri alanına heyecan verici bir katkı olacak.
(Fotoğrafı çeken Sean Robertson)
Ayrıca bakınız: Senatörler güvenlik ve istihdam uygulamaları konusunda OpenAI’yi araştırıyor
Sektör liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: Akıllı Otomasyon Konferansı, BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.
Mistral Large 2: The David to Big Tech’s Goliath(s) yazısı ilk olarak AI News’te çıktı.