Meta araştırmacıları, İnsan oyuncuları kandırarak Diplomaside ustalaşan yapay zeka yaratıyor


Bir CICERO araştırmacısı tarafından sağlanan Diplomasi ekran görüntüsü.
Büyüt / Çevrimiçi bir oyunun ekran görüntüsü diplomasibir Cicero araştırmacısı tarafından sağlanan, çalışan bir sohbet iletişim kutusu dahil.

Salı günü, Meta AI ilan edildi stratejik tahta oyununda insan seviyesinde performans elde eden ilk yapay zeka olduğunu iddia ettiği Cicero’nun gelişimi diplomasi. Bu dikkate değer bir başarıdır çünkü oyun derin kişilerarası müzakere becerileri gerektirir, bu da Cicero’nun oyunu kazanmak için gerekli olan dil konusunda belirli bir ustalık kazandığı anlamına gelir.

Deep Blue, 1997’de satrançta Garry Kasparov’u yenmeden önce bile masa oyunları faydalı önlem yapay zeka başarısı. 2015’te, AlphaGo çıktığında başka bir engel daha düştü. mağlup Usta Lee Sedol’a gidin. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisi izler (ancak Go’nun kuralları genellikle bilgisayar yapay zekası için basitleştirilmiştir).

Fakat diplomasi, oyunun büyük bir kısmı sosyal becerileri içerir. Oyuncular kazanmak için empati göstermeli, doğal bir dil kullanmalı ve ilişkiler kurmalıdır ki bu bir bilgisayar oyuncusu için zor bir görevdir. Bunu akılda tutarak Meta, “İnsanların yaptığına benzer stratejik hedeflere ulaşmak için insanlarla müzakere etmek, ikna etmek ve onlarla birlikte çalışmak için dili kullanabilen daha etkili ve esnek aracılar oluşturabilir miyiz?” diye sordu.

Meta’ya göre cevap evet. Cicero, becerilerini çevrimiçi bir sürümünü oynayarak öğrendi. diplomasi üzerinde webDiplomasi.net. Zamanla, oyunda bir usta haline geldi, bildirildiğine göre insan oyuncuların “ortalama puanının iki katından fazlasını” elde etti ve birden fazla oyun oynayan kişilerin ilk yüzde 10’u arasında yer aldı.

Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal dil işleme (GPT-3’e benzer) için yapay zeka modellerini bir araya getirdi ve bunları tek bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumuna ve konuşma geçmişine bakar ve diğer oyuncuların nasıl davranacağını tahmin eder. İnsan benzeri diyaloglar oluşturabilen ve diğer oyuncularla koordineli çalışmasına izin veren bir dil modeli aracılığıyla yürüttüğü bir plan hazırlar.

<em>Diplomasi</em> oynayan robot Cicero’nun Meta tarafından sağlanan bir blok diyagramı.” src=”https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-640×907.jpg” width=”640″ height=”907″ srcset=”https://cdn.arstechnica.net/wp-content/uploads/2022/11/Visual_UnderTheHood-1280×1813.jpg 2x”/></a><figcaption class=
Büyüt / Cicero’nun bir blok diyagramı, diplomasi-Meta tarafından sağlanan oyun botu.

meta yapay zeka

Meta, Cicero’nun doğal dil becerilerini, Cicero’nun kişiliğinin kalbinin yattığı “kontrol edilebilir bir diyalog modeli” olarak adlandırır. GPT-3 gibi, Cicero da web’den kazınmış büyük bir İnternet metni külliyatından alır. “Kontrol edilebilir bir diyalog modeli oluşturmak için 2,7 milyarlık bir parametreyle başladık. BARTİnternetten alınan metin üzerinde önceden eğitilmiş ve webDiplomacy.net’teki 40.000’den fazla insan oyununda ince ayarı yapılmış benzer bir dil modeli,” yazar Meta.

Ortaya çıkan model, karmaşık bir oyunun inceliklerinde ustalaştı. Meta, “Örneğin, Cicero, oyunun ilerleyen bölümlerinde belirli bir oyuncunun desteğine ihtiyaç duyacağını anlayabilir ve ardından o kişinin gözüne girmek için bir strateji oluşturabilir ve hatta o oyuncunun gördüğü riskleri ve fırsatları fark edebilir” diyor. onların özel bakış açısından.”

Meta’nın Cicero araştırması göründü Science dergisinde “Dil modellerini stratejik akıl yürütmeyle birleştirerek Diplomasi oyununda insan düzeyinde oyun” başlığı altında.

Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının, birisine yeni bir beceri öğretmek için uzun vadeli bir konuşma sürdürmek gibi, insanlar ve yapay zeka arasındaki “iletişim engellerini hafifletebileceğini” öne sürüyor. Veya NPC’lerin tıpkı insanlar gibi konuşabildiği, oyuncunun motivasyonlarını anladığı ve yol boyunca uyum sağladığı bir video oyununu güçlendirebilir.

Aynı zamanda, bu teknoloji, insanları taklit ederek ve bağlama bağlı olarak potansiyel olarak tehlikeli şekillerde kandırarak insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, diğer araştırmacıların kendi kodunu “sorumlu bir şekilde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor; bu muhtemelen Cicero’nun İnternet metinlerinden öğrendiği diyaloğa atıfta bulunuyor. büyük dil modelleri için her zaman bir risktir.

Meta sağlanan ayrıntılı site Cicero’nun nasıl çalıştığını ve ayrıca açık kaynaklı Cicero’nun kodunu açıklamak için GitHub’da. Çevrimiçi diplomasi hayranların – ve hatta belki de geri kalanımızın – dikkat etmesi gerekebilir.


Kaynak : https://arstechnica.com/?p=1899693

Yorum yapın

SMM Panel PDF Kitap indir