Anthropic’in Claude 3.5 Sonnet’i çoğu testte GPT-4o’yu geride bırakıyor

Date:

Antropik başlattı Claude 3.5 Sonerakiplerini geride bırakan ve hatta çeşitli değerlendirmelerde Anthropic’in mevcut en üst seviye Claude 3 Opus’unu bile geride bırakan orta seviye modeli.

Claude 3.5 Sonnet’e artık Claude.ai ve Claude iOS uygulamasından ücretsiz olarak erişilebiliyor; Claude Pro ve Team planı aboneleri için daha yüksek oran limitleri bulunuyor. Ayrıca Anthropic API, Amazon Bedrock ve Google Cloud’un Vertex AI’sı aracılığıyla da kullanılabilir. Model, 200K token içerik penceresine sahip olup, milyon giriş tokenı başına 3 ABD Doları ve milyon çıkış tokenı başına 15 ABD Doları olarak fiyatlandırılmaktadır.

Anthropic, Claude 3.5 Sonnet’in “lisans düzeyinde akıl yürütme (GPQA), lisans düzeyinde bilgi (MMLU) ve kodlama yeterliliği (HumanEval) için yeni endüstri ölçütleri belirlediğini” iddia ediyor. Model, doğal bir tonla yüksek kaliteli içerik üretme konusunda uzmanlaşırken, ince ayrıntıları, mizahı ve karmaşık talimatları anlama konusunda gelişmiş yetenekler sergiliyor.

Claude 3 Opus’un iki katı hızda çalışan Claude 3.5 Sonnet, bağlama duyarlı müşteri desteği ve çok adımlı iş akışı düzenlemesi gibi karmaşık görevler için çok uygundur. Dahili aracılı kodlama değerlendirmesinde sorunların %64’ünü çözerek %38 ile Claude 3 Opus’u önemli ölçüde geride bıraktı.

Model aynı zamanda standart görüş kriterlerinde Claude 3 Opus’u geride bırakan gelişmiş görüş yetenekleri de sergiliyor. Bu ilerleme özellikle tablo ve grafiklerin yorumlanması gibi görsel muhakeme gerektiren görevlerde fark edilir. Claude 3.5 Sonnet, perakende, lojistik ve finansal hizmetler gibi endüstriler için değerli bir özellik olan, kusurlu görüntülerden metni doğru bir şekilde kopyalayabilir.

Anthropic, model lansmanının yanı sıra, yapay zeka ile kullanıcı etkileşimini geliştiren yeni bir özellik olan Claude.ai’de Artifacts’ı tanıttı. Bu özellik, kullanıcıların Claude’un oluşturduğu içeriği gerçek zamanlı olarak görüntülemesine, düzenlemesine ve geliştirmesine olanak tanıyarak daha işbirlikçi bir çalışma ortamı yaratır.

Önemli istihbarat sıçramasına rağmen Claude 3.5 Sonnet, Anthropic’in güvenlik ve mahremiyet konusundaki kararlılığını sürdürüyor. Şirket şunu belirtiyor: “Modellerimiz sıkı testlere tabi tutuluyor ve kötüye kullanımı azaltacak şekilde eğitiliyor.”

Birleşik Krallık dahil olmak üzere dış uzmanlar Yapay Zeka Güvenliği Enstitüsü (UK AISI) ve çocuk güvenliği uzmanları Dikenmodelin güvenlik mekanizmalarının test edilmesi ve iyileştirilmesinde yer aldı.

Anthropic, kullanıcı gizliliğine olan bağlılığını vurgulayarak şunları söylüyor: “Kullanıcı bize açıkça izin vermediği sürece, üretken modellerimizi kullanıcı tarafından gönderilen veriler üzerinde eğitmiyoruz. Bugüne kadar üretken modellerimizi eğitmek için müşteri veya kullanıcı tarafından gönderilen hiçbir veriyi kullanmadık.”

İleriye baktığımızda Anthropic, Claude 3.5 model ailesini tamamlamak için Claude 3.5 Haiku ve Claude 3.5 Opus’u bu yılın sonlarında piyasaya sürmeyi planlıyor. Şirket ayrıca, kurumsal uygulamalarla entegrasyonlar ve daha kişiselleştirilmiş kullanıcı deneyimleri için bir bellek özelliği de dahil olmak üzere, daha fazla ticari kullanım senaryosunu desteklemek için yeni yöntemler ve özellikler geliştiriyor.

(Resim Kredisi: Antropik)

Ayrıca bakınız: OpenAI kurucu ortağı Ilya Sutskever’in yeni girişimi ‘güvenli süper zekayı’ hedefliyor

Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: Akıllı Otomasyon Konferansı, BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Etiketler: ai, antropik, yapay zeka, kıyaslama, Claude, Claude 3.5, Model

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Subscribe

spot_img

Popular

More like this
Related