LG AI Research, matematik, bilim ve kodlamada karmaşık problem çözme konusunda başarılı olan bir akıl yürütme modeli olan Exaone Deep’i tanıttı.
Şirket, şu anda, sadece temel modellere sahip bir avuç kuruluşun aktif olarak bu karmaşık alanı takip ettiğini belirterek, gelişmiş akıl yürütme modelleri yaratmada küresel zorluğu vurguladı. Exaone Deep, rekabetçi bir akıl yürütme yeteneğini sergileyen bu önde gelen modellerle doğrudan rekabet etmeyi amaçlamaktadır.
LG AI Research, çabalarını Exaone Deep’in temel alanlardaki akıl yürütme yeteneklerini önemli ölçüde geliştirmeye odakladı. Model ayrıca daha geniş bir konu yelpazesinde bilgiyi anlama ve uygulama konusunda güçlü bir yetenek gösterir.
LG AI Research tarafından yayınlanan performans kriterleri etkileyici:
- Matematik: Exaone Deep 32B modeli, zorunlu bir matematik kıyaslamasında boyutunun sadece% 5’i olmasına rağmen rakip bir modelden daha iyi performans gösterdi. Ayrıca, 7.8b ve 2.4b versiyonları, tüm büyük matematik ölçümlerinde kendi model boyutları için birincilik elde etti.
- Bilim ve Kodlama: Bu alanlarda, Exaone Deep Modelleri (7.8b ve 2.4b) tüm büyük ölçütlerde en üst sırada yer aldı.
- MMLU (devasa çoklu görev dili anlayışı): 32B modeli, MMLU kıyaslamasında 83.0 puan elde etti;
Exaone Deep 32B modelinin yetenekleri zaten uluslararası tanınırlık kazanmıştır.
Serbest bırakılmasından kısa bir süre sonra, ABD merkezli kar amacı gütmeyen araştırma organizasyonu tarafından ‘dikkate değer AI modelleri’ listesine dahil edildi. Epoch ai. Bu liste, selefi Exaone 3.5’in yanına Exaone’u derinleştirerek LG’yi son iki yılda bu prestijli listede yer alan modellerle tek Koreli varlık haline getiriyor.
Matematik becerisi
Exaone Deep, çeşitli model boyutlarında (32b, 7.8b ve 2.4b) olağanüstü matematiksel akıl yürütme becerileri göstermiştir. 2025 Akademik Yıl Matematik Müfredatına dayanan değerlendirmelerde, her üç model de karşılaştırılabilir büyüklükte küresel akıl yürütme modellerinden daha iyi performans gösterdi.
32B modeli, genel matematik yetkinlik testinde 94.5 ve Amerikan Invitational Matematik Sınavı (AIME) 2024’te 90.0 puan aldı, ABD Matematik Olimpiyatı için bir nitelik sınavı.
AIME 2025’te 32B modeli, önemli ölçüde daha büyük bir 671B modeli olan Deepseek-R1’in performansıyla eşleşti. Bu sonuç, özellikle zorlu matematiksel sorunlarla mücadele ederken Exaone Deep’in etkili öğrenmesini ve güçlü mantıksal akıl yürütme yeteneklerini sergilemektedir.
Daha küçük 7.8b ve 2.4b modelleri, sırasıyla hafif ve cihaz içi modeller için ana kriterlerde üst sıralarda yer aldı. 7.8B modeli Math-500 ölçütünde 94.8 ve AIME 2025’te 59.6 puan alırken, 2.4b modeli aynı değerlendirmelerde 92.3 ve 47.9 puan aldı.
Bilim ve Kodlama Mükemmelliği
Exaone Deep, profesyonel bilim akıl yürütme ve yazılım kodlamasında da dikkate değer yetenekler sergilemiştir.
32B modeli, doktora düzeyinde fizik, kimya ve biyolojide problem çözme becerilerini değerlendiren GPQA elmas testinde 66.1 puan aldı. Kodlama yeterliliğini ölçen LiveCodebench değerlendirmesinde, model 59.5 puan elde etti ve bu uzman alanlarındaki üst düzey uygulamalar potansiyelini gösterdi.
7.8b ve 2.4b modelleri, hem GPQA Diamond hem de LiveCodeBench ölçütlerinde birinci sırada yer alan güçlü performans eğilimine devam etti. Bu başarı, daha önce Hugging Face’in LLM okuyucu tahtasını Edge bölümünde zirveye çıkaran Exaone 3.5 2.4b modelinin başarısına dayanıyor.
Gelişmiş genel bilgi
Özel akıl yürütme yeteneklerinin ötesinde, Exaone Deep de genel bilgi anlayışında gelişmiş performans göstermiştir.
32B modeli, MMLU kıyaslamasında etkileyici bir skor elde etti ve bu kapsamlı değerlendirmede en iyi performans gösteren yerli model olarak konumlandırıldı. Bu, Exaone Deep’in akıl yürütme geliştirmelerinin belirli alanların ötesine uzandığını ve çeşitli konuların daha geniş bir şekilde anlaşılmasına katkıda bulunduğunu gösterir.
LG AI Research, Exaone Deep’in akıl yürütme gelişmelerinin, AI’nın giderek daha karmaşık sorunlarla başa çıkabileceği ve sürekli araştırma ve yenilik yoluyla insan hayatını zenginleştirmeye ve basitleştirmeye katkıda bulunabileceği bir geleceğe yönelik bir sıçrama temsil ettiğine inanıyor.
Ayrıca bakınız: Baidu, Ernie 4.5 ve Ernie X1 ile rakip AI modellerini altüst ediyor
Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.