ARC Ödülü henüz en zor AI kıyaslamasını başlattı: Arc-agi-2

By: coinhaber.net

Date:

Mart 25, 2025

Arc Ödülü 2025 yarışmalarının 1 milyon dolarlık ödülle duyurulmasıyla birlikte hardcore ark-agi-2 ölçütünü başlattı.

Yapay zeka dar görevler yapmaktan genel, uyarlanabilir zeka göstermeye ilerledikçe, ARC-AGI-2 zorlukları yetenek boşluklarını ortaya çıkarmayı ve inovasyonu aktif olarak yönlendirmeyi amaçlamaktadır.

ARC Ödül Ekibi, “İyi AGI kriterleri yararlı ilerleme göstergeleri olarak işlev görüyor. Daha iyi AGI kriterleri yetenekleri açıkça ayırt ediyor. En iyi AGI ölçütleri tüm bunları yapıyor ve araştırmaya ve yeniliğe rehberlik ediyor” diyor.

Arc-agu-2 “en iyi” kategorisini elde etmek için yola çıkıyor.

İçindekiler

1 Ezberlemenin ötesinde
2 ARC-AGI-2: İnsan Makine Boşluğunu Kapatma
3 Verimliliğin rolü
4 ARC Ödülü 2025

Ezberlemenin ötesinde

2019’daki kuruluşundan bu yana, ARC Ödülü, kalıcı ölçütler oluşturarak AGI’ya yönelik araştırmacılar için bir “Kuzey Yıldızı” olarak hizmet etti.

ARC-AGI-1 gibi kriterler, sıvı zekasını ölçmeye eğildi (yani, öğrenmeyi yeni görünmeyen görevlere uyarlama yeteneği). Yalnızca ezberlemeyi ödüllendiren veri kümelerinden net bir şekilde ayrılmayı temsil ediyordu.

Arc Ödülü’nün misyonu, bilimsel atılımlar için zaman çizelgelerini hızlandırmayı hedefleyen ileri görüşlüdür. Kıyasları sadece ilerlemeyi ölçmek için değil, yeni fikirlere de ilham vermek için tasarlanmıştır.

Araştırmacılar, ARC-AGI-1 kullanılarak değerlendirilen 2024’ün sonlarında Openai’nin O3’ünün çıkışıyla kritik bir değişim gözlemlediler. Derin öğrenme tabanlı büyük dil modellerini (LLM’ler) akıl yürütme sentez motorlarıyla birleştiren O3, AI’nın ezberlemenin ötesine geçtiği bir atılım oldu.

Yine de, ilerlemeye rağmen, O3 gibi sistemler verimsiz kalır ve eğitim süreçleri sırasında önemli insan gözetimi gerektirir. Bu sistemleri gerçek uyarlanabilirlik ve verimlilik için zorlamak için ARC Ödülü ARC-AGI-2’yi tanıttı.

ARC-AGI-2: İnsan Makine Boşluğunu Kapatma

ARC-AGI-2 ölçütü yapay zeka için daha zordur, ancak insanlar için erişilebilirliğini korur. Frontier AI akıl yürütme sistemleri ARC-AGI-2’de tek haneli yüzdelerde puan almaya devam ederken, insanlar her görevi iki denemede çözebilirler.

Peki, ARC-AGI’yi ayıran nedir? Tasarım felsefesi, “insanlar için nispeten kolay, ancak yapay zeka için zor veya imkansız” görevleri seçer.

Benchmark, değişen görünürlük ve aşağıdaki özelliklere sahip veri kümeleri içerir:

Sembolik Yorum: AI, simetri kontrolleri gibi sığ karşılaştırmalara odaklanarak sembollere semantik önem vermeye çalışır.
Kompozisyon Akıl Yürütme: AI, aynı anda birden fazla etkileşen kural uygulaması gerektiğinde azalır.
Bağlamsal Kural Uygulaması: Sistemler, genellikle yüzey düzeyinde desenlere sabitlenen karmaşık bağlamlara dayalı olarak kuralları farklı uygulayamaz.

Mevcut kriterlerin çoğu, insanüstü yeteneklere odaklanır, çoğu kişi için ulaşılamaz ölçeklerde ileri düzeyde özel becerileri test eder.

Arc-agi senaryoyu çevirir ve AI’nın henüz yapamayacağını vurgular; Özellikle insan zekasını tanımlayan uyarlanabilirlik. İnsanlar için kolay ancak AI için zor olan görevler arasındaki boşluk sonunda sıfıra ulaştığında, AGI elde edilebilecek ilan edilebilir.

Bununla birlikte, AGI elde etmek görevleri çözme yeteneği ile sınırlı değildir; Verimlilik – çözüm bulmak için gereken maliyet ve kaynaklar – önemli bir tanımlayıcı faktör olarak ortaya çıkmaktadır.

Verimliliğin rolü

Performansı görev başına maliyetle ölçmek, sadece problem çözme yeteneği değil, aynı zamanda verimli bir şekilde yapma yeteneği olarak zekayı ölçmek için gereklidir.

Gerçek dünya örnekleri zaten insanlar ve sınır AI sistemleri arasında verimlilik boşlukları göstermektedir:

İnsan Paneli Verimliliği: ARC-AGI-2 görevlerini% 100 doğrulukla 17 $/görevle geçer.
Openai O3: İlk tahminler, görev başına 200 $ ‘lık bir göz susturan% 4 başarı oranını göstermektedir.

Bu metrikler, insanlar ve yapay zeka arasındaki uyum ve kaynak tüketiminde farklılıkların altını çizmektedir. ARC Ödülü, gelecekteki liderlik tablolarında puanların yanı sıra verimlilik raporunu vermeyi taahhüt etmiştir.

Verimliliğe odaklanma, kaba kuvvet çözümlerinin “gerçek zeka” olarak kabul edilmesini önler.

ARC Ödülü’ne göre istihbarat, minimum kaynaklara sahip çözümler bulmayı kapsar – kalite belirgin bir insan ama yine de yapay zeka için zor.

ARC Ödülü 2025

ARC Ödülü 2025 Kaggle Bu hafta, toplam ödüllerde 1 milyon dolar vaat ediyor ve açık kaynaklı atılımlar için canlı bir liderlik sergiliyor. Yarışma, ARC-AGI-2 zorluklarını etkili bir şekilde ele alabilecek sistemlere doğru ilerlemeyi yönlendirmeyi amaçlıyor.

2024 toplamından artarak ödül kategorileri arasında:

Büyük Ödül: Kaggle verimlilik sınırları içinde% 85 başarıya ulaştığı için 700.000 dolar.
En İyi Skor Ödülü: En yüksek puan alan sunum için 75.000 dolar.
Kağıt Ödülü: Ark-AGI görevlerinin çözülmesine katkıda bulunan dönüştürücü fikirler için 50.000 dolar.
Ek Ödüller: 175.000 dolar, yarışma sırasında desenleri bekleyen ayrıntılarla.

Bu teşvikler, araştırmacılar, laboratuvarlar ve bağımsız ekipler arasında işbirliğini teşvik ederken adil ve anlamlı bir ilerleme sağlar.

https://www.youtube.com/watch?v=z6cttkvqayg

Geçen yıl, ARC Ödülü 2024 1.500 rakip takımı gördü ve bu da 40 tanınan endüstri etkisi makalesine neden oldu. Bu yılki artan hisse senetleri daha da fazla başarıyı beslemeyi hedefliyor.

ARC Ödülü, sadece mevcut sistemleri ölçeklendirmek yerine yeni fikirlere ilerlemeye inanıyor. Verimli genel sistemlerde bir sonraki atılım, mevcut teknoloji devlerinden değil, karmaşıklığı ve meraklı deneyleri benimseyen cesur, yaratıcı araştırmacılardan kaynaklanabilir.

(Resim Kredisi: ARC Ödülü)

Ayrıca bakınız: Deepseek V3-0324, ilk önce açık kaynaklı olmayan AI modellerini üstlenmeyen AI modelleri

Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Önceki İçerik

Deepseek V3-0324 İlk önce açık kaynaklı rakip AI modellerini yener

Sonraki İçerik

Farmasötik endüstrisi için yapay zeka tarafından desteklenen ediscovery

coinhaber.net http://www.coinhaber.net

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

Share post:

Popular

More like this
Related