OpenAI’nin GPT-4’ü, profesyonel ölçütlerde “insan düzeyinde performans” sergiliyor


Yayılan bir siluetin yapay zeka tarafından oluşturulmuş renkli bir görüntüsü.

Ars Teknik

Salı günü, OpenAI duyurulan GPT-4, OpenAI’ye göre “çeşitli profesyonel ve akademik ölçütlerde insan düzeyinde performans sergileyen” metin çıktısı döndürürken metin ve görüntü girişlerini kabul edebilen büyük bir çok modlu model. Ayrıca Salı günü, Microsoft ilan edildi Bing Chat’in başından beri GPT-4’te çalıştığını.

İddia edildiği gibi çalışırsa, GPT-4 potansiyel olarak yapay zekada yeni bir çağın açılışını temsil eder. OpenAI duyurusunda “Sınava girenlerin ilk %10’u civarında bir puanla simüle edilmiş bir bar sınavını geçiyor” diye yazıyor. “Buna karşılık, GPT-3.5’in puanı en düşük %10 civarındaydı.”

OpenAI, GPT-4’ün metin özelliğini ChatGPT ve ticari API’si aracılığıyla yayınlamayı planlıyor, ancak bekleme listesi Başta. GPT-4 şu anda ChatGPT Plus aboneleri tarafından kullanılabilir. Ayrıca firma, GPT-4’ün görüntü girişi özelliğini tek bir ortakla test ediyor. gözlerim olbir sahneyi tanıyabilen ve onu tanımlayabilen yakında çıkacak bir akıllı telefon uygulaması.

Tanıtım web sitesinin yanı sıra, OpenAI ayrıca bir teknik kağıt GPT-4’ün yeteneklerini ve bir sistem modeli kartı sınırlamalarını ayrıntılı olarak açıklamaktadır.

14 Mart 2023'te GPT-4'ün ChatGPT Plus müşterilerine tanıtımının ekran görüntüsü.
Büyüt / 14 Mart 2023’te GPT-4’ün ChatGPT Plus müşterilerine tanıtımının ekran görüntüsü.

Benj Edwards / Ars Technica

GPT, “üretken önceden eğitilmiş transformatör” anlamına gelir ve GPT-4, orijinaline kadar uzanan bir dizi temel dil modelinin parçasıdır GPT 2018’de. Orijinal sürümün ardından OpenAI, 2019’da GPT-2’yi ve 2020’de GPT-3’ü duyurdu. GPT-3.5 adlı başka bir iyileştirme 2022’de geldi. GPT-3.5 tabanlı model.

GPT serisindeki AI modelleri, büyük ölçüde internetten alınan büyük bir metin gövdesini kullanarak bir belirteç dizisindeki bir sonraki belirteci (bir kelimenin bir parçası) tahmin edecek şekilde eğitilmiştir. Eğitim sırasında sinir ağı, kelimeler ve kavramlar arasındaki ilişkileri temsil eden istatistiksel bir model oluşturur. Zaman içinde OpenAI, her bir GPT modelinin boyutunu ve karmaşıklığını artırdı; bu da, göreve göre değişse de, bir insanın aynı senaryoda metni nasıl tamamlayacağına kıyasla, modelden modele genel olarak daha iyi performansla sonuçlandı.

Görevler söz konusu olduğunda, GPT-4’ün performansı dikkate değerdir. Seleflerinde olduğu gibi, doğal dilde karmaşık talimatları takip edebilir ve teknik veya yaratıcı işler üretebilir, ancak bunu daha derinlemesine yapabilir: 32.768 önceki modellere göre çok daha uzun içerik oluşturmaya veya belge analizine izin veren belirteçler (yaklaşık 25.000 kelimelik metin).

OpenAI, GPT-4’ün yeteneklerini analiz ederken modele aşağıdaki gibi testler yaptırdı: Üniforma Bar Sınavı, Hukuk Fakültesine Giriş Sınavı (LSAT), Yüksek Lisans Kayıt Sınavı (GRE) Kantitatifve çeşitli AP konu testleri. Görevlerin çoğunda, insan seviyesinde puan aldı. Bu, GPT-4’ün yalnızca sınava girme becerisine göre değerlendirilen bir kişi olsaydı, hukuk fakültesine ve muhtemelen birçok üniversiteye girebileceği anlamına gelir.




Kaynak : https://arstechnica.com/?p=1923938

Yorum yapın

SMM Panel PDF Kitap indir