Mistral AI ve NVIDIA, 12B NeMo modelini tanıtıyor

Date:

Mistral Yapay Zeka ile ortaklaşa oluşturulan 12B modeli NeMo’yu duyurdu NVIDIA. Bu yeni model, 128.000’e kadar jetondan oluşan etkileyici bir bağlam penceresine sahiptir ve kendi boyut kategorisi için akıl yürütme, dünya bilgisi ve kodlama doğruluğu konularında en son teknoloji performansı iddia etmektedir.

Mistral AI ve NVIDIA arasındaki işbirliği, yalnızca performansın sınırlarını zorlamakla kalmayıp aynı zamanda kullanım kolaylığını da ön planda tutan bir modelle sonuçlandı. Mistral NeMo, standart mimariye bağlılığı sayesinde halihazırda Mistral 7B kullanan sistemlerin kusursuz bir alternatifi olacak şekilde tasarlanmıştır.

Mistral AI, benimsenmeyi ve daha fazla araştırmayı teşvik etmek amacıyla hem önceden eğitilmiş temel hem de talimatlara göre ayarlanmış kontrol noktalarını Apache 2.0 lisansı altında kullanıma sundu. Bu açık kaynak yaklaşımının hem araştırmacıların hem de işletmelerin ilgisini çekmesi muhtemeldir ve potansiyel olarak modelin çeşitli uygulamalara entegrasyonunu hızlandıracaktır.

Mistral NeMo’nun en önemli özelliklerinden biri, eğitim sırasında performanstan ödün vermeden FP8 çıkarımına olanak tanıyan nicemleme farkındalığıdır. Bu yetenek, büyük dil modellerini verimli bir şekilde dağıtmak isteyen kuruluşlar için hayati öneme sahip olabilir.

Mistral AI, Mistral NeMo temel modeli ile yeni açık kaynaklı, önceden eğitilmiş iki model arasında performans karşılaştırmaları sağladı: Gemma 2 9B ve Llama 3 8B.

“Model küresel, çok dilli uygulamalar için tasarlandı. Mistral AI, işlev çağırma konusunda eğitilmiştir, geniş bir bağlam penceresine sahiptir ve özellikle İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe dillerinde güçlüdür, diye açıkladı.

“Bu, öncü yapay zeka modellerini, insan kültürünü oluşturan tüm dillerde herkesin eline geçirmeye yönelik yeni bir adımdır.”

Mistral NeMo, Tiktoken’i temel alan yeni tokenizer Tekken’i tanıtıyor. 100’den fazla dilde eğitim almış olan Tekken, önceki Mistral modellerinde kullanılan SentencePiece tokenizer’a kıyasla hem doğal dildeki metin hem de kaynak kodu için gelişmiş sıkıştırma verimliliği sunuyor. Şirket, Tekken’in kaynak kodunu ve birçok ana dili sıkıştırmada yaklaşık %30 daha verimli olduğunu, Korece ve Arapça için ise daha da önemli kazanımlar sağladığını bildiriyor.

Mistral AI ayrıca Tekken’in tüm dillerin yaklaşık %85’i için metin sıkıştırmada Llama 3 tokenizer’dan daha iyi performans gösterdiğini ve Mistral NeMo’ya çok dilli uygulamalarda potansiyel olarak avantaj sağladığını iddia ediyor.

Modelin ağırlıkları artık her iki model için de HuggingFace’te mevcut. temel Ve öğretmek versiyonları. Geliştiriciler mistral çıkarım aracını kullanarak Mistral NeMo ile deneyler yapmaya başlayabilir ve onu mistral ince ayar ile uyarlayabilir. Mistral platformunu kullananlar için modele open-mistral-nemo adı altında ulaşılabiliyor.

NVIDIA ile yapılan işbirliğine bir gönderme olarak Mistral NeMo aynı zamanda bir NVIDIA NIM çıkarım mikro hizmeti olarak da paketlenmiştir. ai.nvidia.com. Bu entegrasyon, NVIDIA’nın yapay zeka ekosistemine halihazırda yatırım yapmış kuruluşlar için dağıtımı kolaylaştırabilir.

Mistral NeMo’nun piyasaya sürülmesi, gelişmiş yapay zeka modellerinin demokratikleştirilmesinde ileriye doğru atılan önemli bir adımı temsil ediyor. Mistral AI ve NVIDIA, yüksek performansı, çok dilli yetenekleri ve açık kaynak kullanılabilirliğini birleştirerek bu modeli, çeşitli endüstriler ve araştırma alanlarındaki çok çeşitli AI uygulamaları için çok yönlü bir araç olarak konumlandırıyor.

(Fotoğrafı çeken David Clode)

Ayrıca bakınız: Meta, AI modellerini AB kullanıcılarından alıkoyma konusunda Apple’a katıldı

Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: Akıllı Otomasyon Konferansı, BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Etiketler: ai, yapay zeka, geliştirme, mistral ai, Model, nemo, tekken

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Subscribe

spot_img

Popular

More like this
Related