Chatgpt karmaşık araştırma için ajan yeteneği kazanır

Date:

Openai, ChatGPT’nin çevrimiçi olarak karmaşık, çok aşamalı araştırma görevleri yapmasını sağlayan güçlü bir ajan yeteneği yayınlıyor. Deep Research olarak adlandırılan özelliğin, onlarca dakika içinde bir insan araştırmacı saatini hatta günleri alabileceği bildiriliyor.

Openai, Yapay Genel İstihbarat’a (AGI) yolculuğunda derin araştırmaları önemli bir kilometre taşı olarak tanımlamaktadır.

“Bilgiyi sentezleme yeteneği yeni bilgi yaratmak için bir ön koşuldur” diyor Openai. “Bu nedenle, Derin Araştırma, AGI geliştirme hedefimize doğru önemli bir adım atıyor.”

Ajan AI, ChatGPT’nin karmaşık araştırmalara yardımcı olmasını sağlar

Deep Research, Chatgpt’in yüzlerce çevrimiçi kaynaktan bilgi bulma, analiz etmesi ve sentezlemesi güçlendirir. Openai’ye göre, sadece kullanıcıdan bir istem ile araç, bir araştırma analistinin çıktısıyla karşılaştırılabilecek kapsamlı bir rapor sunabilir.

Openai’nin yaklaşan “O3” modelinin bir varyantından yetenekler çizen amaç, kullanıcıları zaman alıcı, emek yoğun bilgi toplama işleminden kurtarmaktır. İster akış platformlarının rekabetçi bir analizi, hatta yeni bir banliyö bisikleti için kişiselleştirilmiş öneriler olsun, derin araştırmalar kesin ve güvenilir sonuçlar vaat ediyor.

Önemli olarak, her çıktı tam alıntılar ve şeffaf belgeler içerir – kullanıcıların bulguları kolaylıkla doğrulamalarını sağlayan.

Araç, özellikle niş veya sezgisel olmayan anlayışları ortaya çıkarmada usta görünerek, finans, bilim, politika yapımı ve mühendislik gibi sektörlerde paha biçilmez bir varlık haline getiriyor. Ancak Openai ayrıca, hiper kişiselleştirilmiş öneriler veya belirli bir ürün arayan alışveriş yapanlar gibi ortalama bir kullanıcı için yararlı olan derin araştırmalar öngörmektedir.

Bu son Ajan yeteneği, ChatGPT’nin kullanıcı arayüzü aracılığıyla çalışır; Kullanıcılar mesaj bestecisindeki “Derin Araştırma” seçeneğini seçer ve sorgularını yazarlar. Destekler veya e -tablolar ek bağlam için yüklenebilir.

Başladıktan sonra, AI tamamlanması 5-30 dakika sürebilen titiz bir çok aşamalı işleme başlar. Bir kenar çubuğu, alınan işlemler ve danışılan kaynaklar hakkında güncellemeler sağlar. Kullanıcılar diğer görevlere devam edebilir ve nihai rapor hazır olduğunda bilgilendirilecektir.

Sonuçlar sohbette ayrıntılı, iyi belgelenmiş raporlar olarak sunulmaktadır. Önümüzdeki haftalarda Openai, daha fazla netlik ve bağlam sunmak için görüntüleri, veri görselleştirmelerini ve grafikleri yerleştirerek bu çıktıları daha da geliştirmeyi planlıyor.

Gerçek zamanlı, multimodal konuşmalarda mükemmel olan GPT-4O’nun aksine, derin araştırma derinlik ve detaylara öncelik verir. Kaynakları titizlikle alıntı yapma ve kapsamlı analizler sunma yeteneği, odağı hızlı, özetlenmiş cevaplardan iyi belgelenmiş, araştırma dereceli bilgilere atar.

Gerçek dünyadaki zorluklar için inşa edilmiş

Derin Rsearch, farklı alanlarda gerçek dünyadaki tarama ve akıl yürütme görevlerine dayanan sofistike eğitim metodolojilerinden yararlanır. Modeli, yeni bilgiler mevcut hale geldikçe, geri izleme ve yaklaşımını uyarlama ve uyarlama da dahil olmak üzere çok adımlı araştırma süreçlerini özerk bir şekilde planlamak ve yürütmek için takviye öğrenimi ile eğitildi.

Araç, kullanıcı yüklü dosyalara göz atabilir, Python kullanarak grafikler oluşturabilir ve yineleyebilir, oluşturulan görüntüler ve web sayfaları gibi ortamları yanıtlara gömebilir ve kaynaklarından tam cümleler veya pasajlar belirtebilir. Bu kapsamlı eğitimin sonucu, karmaşık gerçek dünya sorunlarıyla mücadele etmek için oldukça yetenekli bir ajandır.

https://www.youtube.com/watch?v=jv-lpisnloo

Openai, “İnsanlığın Son Sınavı” olarak bilinen çok çeşitli uzman düzeyinde sınavlarda derin araştırmaları değerlendirdi. Roket bilimi ve dilbilimden ekoloji ve klasiklere kadar konuları kapsayan 3.000’den fazla sorudan oluşan sınavlar, AI’nın çok yönlü problemleri çözmedeki yetkinliğini test ediyor.

Sonuçlar etkileyiciydi, model bu alanlarda rekor kıran% 26,6 doğruluk elde ediyordu:

  • GPT-4O:% 3,3
  • Grok-2:% 3.8
  • Claude 3.5 sonnet:% 4.3
  • Openai O1:% 9.1
  • Deepseek-R1:% 9.4
  • Derin Araştırma:% 26.6 (Göz atma + Python Araçları ile)

Deep Research ayrıca, AI modellerini akıl yürütme, çok modlu akıcılık ve araç kullanımı yeterliliği gerektiren gerçek dünya soruları üzerinde değerlendiren Gaia karşılaştırmasında son teknoloji ürünü bir performansa ulaştı. Derin araştırma lider tahtası %72.57 puanla.

Sınırlamalar ve zorluklar

CHATGPT’deki derin araştırma aracı AI yeteneği, cesur bir adım ileriye dönük olsa da, Openai teknolojinin hala erken aşamalarında olduğunu ve sınırlamalarla birlikte geldiğini kabul ediyor.

Openai’ye göre, sistem zaman zaman mevcut GPT modellerine kıyasla önemli ölçüde düşük bir oranda olsa da gerçekleri “halüsinasyon yapar” veya yanlış çıkarımlar sunar. Ayrıca, yetkili kaynaklar ve spekülatif içerik arasında farklılaşma konusunda zorluklarla karşı karşıyadır ve güven seviyelerini kalibre etmek için mücadele eder – genellikle potansiyel olarak belirsiz bulgular için gereksiz bir kesinlik gösterir.

Raporlarda ve alıntılardaki küçük biçimlendirme hataları ve görevleri başlatma gecikmeleri de ilk kullanıcıları hayal kırıklığına uğratabilir. Openai, bu sorunların daha fazla kullanım ve yinelemeli iyileştirmelerle zamanla iyileşmesi beklendiğini söylüyor.

Openai, ayda 100’e kadar sorguya erişebilecek olan profesyonel kullanıcılardan başlayarak yeteneği kademeli olarak kullanıyor. Artı ve takım katmanları takım elbise izleyecek, kurumsal erişim bir sonraki geliyor.

İngiltere, İsviçre ve Avrupa Ekonomik Bölgesi sakinleri henüz bu özelliğe erişemiyorlar, ancak Openai, sunumunu bu bölgelere genişletmek için çalıştığını söylüyor.

Önümüzdeki haftalarda Openai, özelliği ChatGPT’nin mobil ve masaüstü platformlarına genişletecek. Uzun vadeli vizyon, aboneliğe dayalı veya tescilli veri kaynaklarına bağlantıların etkinleştirilmesini ve çıktılarının sağlamlığını ve kişiselleştirilmesini daha da artırmayı içerir.

Daha ileriye baktığımızda Openai, derin araştırmaları gerçek dünya eylemleri yapan mevcut bir sohbet botu özelliği olan “operatör” ile entegre etmeyi öngörüyor. Bu entegrasyon, ChatGPT’nin hem eşzamansız çevrimiçi araştırmalar hem de gerçek dünya yürütülmesi gerektiren görevleri sorunsuz bir şekilde ele almasına izin verecektir.

(Fotoğraf John Schnobrich)

Ayrıca bakınız: Microsoft ve Openai Probu Deepseek tarafından veri hırsızlığı iddia etti

Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon KonferansıBlockx Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

[tds_leads title_text="Subscribe" input_placeholder="Email address" btn_horiz_align="content-horiz-center" pp_checkbox="yes" pp_msg="SSd2ZSUyMHJlYWQlMjBhbmQlMjBhY2NlcHQlMjB0aGUlMjAlM0NhJTIwaHJlZiUzRCUyMiUyMyUyMiUzRVByaXZhY3klMjBQb2xpY3klM0MlMkZhJTNFLg==" f_title_font_family="653" f_title_font_size="eyJhbGwiOiIyNCIsInBvcnRyYWl0IjoiMjAiLCJsYW5kc2NhcGUiOiIyMiJ9" f_title_font_line_height="1" f_title_font_weight="700" f_title_font_spacing="-1" msg_composer="success" display="column" gap="10" input_padd="eyJhbGwiOiIxNXB4IDEwcHgiLCJsYW5kc2NhcGUiOiIxMnB4IDhweCIsInBvcnRyYWl0IjoiMTBweCA2cHgifQ==" input_border="1" btn_text="I want in" btn_tdicon="tdc-font-tdmp tdc-font-tdmp-arrow-right" btn_icon_size="eyJhbGwiOiIxOSIsImxhbmRzY2FwZSI6IjE3IiwicG9ydHJhaXQiOiIxNSJ9" btn_icon_space="eyJhbGwiOiI1IiwicG9ydHJhaXQiOiIzIn0=" btn_radius="3" input_radius="3" f_msg_font_family="653" f_msg_font_size="eyJhbGwiOiIxMyIsInBvcnRyYWl0IjoiMTIifQ==" f_msg_font_weight="600" f_msg_font_line_height="1.4" f_input_font_family="653" f_input_font_size="eyJhbGwiOiIxNCIsImxhbmRzY2FwZSI6IjEzIiwicG9ydHJhaXQiOiIxMiJ9" f_input_font_line_height="1.2" f_btn_font_family="653" f_input_font_weight="500" f_btn_font_size="eyJhbGwiOiIxMyIsImxhbmRzY2FwZSI6IjEyIiwicG9ydHJhaXQiOiIxMSJ9" f_btn_font_line_height="1.2" f_btn_font_weight="700" f_pp_font_family="653" f_pp_font_size="eyJhbGwiOiIxMyIsImxhbmRzY2FwZSI6IjEyIiwicG9ydHJhaXQiOiIxMSJ9" f_pp_font_line_height="1.2" pp_check_color="#000000" pp_check_color_a="#ec3535" pp_check_color_a_h="#c11f1f" f_btn_font_transform="uppercase" tdc_css="eyJhbGwiOnsibWFyZ2luLWJvdHRvbSI6IjQwIiwiZGlzcGxheSI6IiJ9LCJsYW5kc2NhcGUiOnsibWFyZ2luLWJvdHRvbSI6IjM1IiwiZGlzcGxheSI6IiJ9LCJsYW5kc2NhcGVfbWF4X3dpZHRoIjoxMTQwLCJsYW5kc2NhcGVfbWluX3dpZHRoIjoxMDE5LCJwb3J0cmFpdCI6eyJtYXJnaW4tYm90dG9tIjoiMzAiLCJkaXNwbGF5IjoiIn0sInBvcnRyYWl0X21heF93aWR0aCI6MTAxOCwicG9ydHJhaXRfbWluX3dpZHRoIjo3Njh9" msg_succ_radius="2" btn_bg="#ec3535" btn_bg_h="#c11f1f" title_space="eyJwb3J0cmFpdCI6IjEyIiwibGFuZHNjYXBlIjoiMTQiLCJhbGwiOiIxOCJ9" msg_space="eyJsYW5kc2NhcGUiOiIwIDAgMTJweCJ9" btn_padd="eyJsYW5kc2NhcGUiOiIxMiIsInBvcnRyYWl0IjoiMTBweCJ9" msg_padd="eyJwb3J0cmFpdCI6IjZweCAxMHB4In0="]
spot_img

Popular

More like this
Related