Zeka ve Anlama – O’Reilly


Son zamanlarda AI hakkında fazla bir şey yazmadım. Ancak, Google’ın yeni Büyük Dil Modelleri (LLM’ler) hakkında yakın zamanda yapılan bir tartışma ve bu modellerden birinin (Gopher adlı) kanıtladığı iddiası insan performansına yaklaşan okuduğunu anlama, idrak, muğlaklık, zeka ve irade hakkında bazı düşünceleri teşvik etmiştir. (okumakta fayda var Büyük Modeller Bizi Anlıyor mu?Blaise Agüera y Arcas’ın aynı yönde ilerleyen daha kapsamlı bir makalesi.)

Okuduğunu anlamaktan ne anlamalıyız? Basit bir işlemsel tanımla başlayabiliriz: Okuduğunu anlama, okuduğunu anlama testiyle ölçülen şeydir. Bu tanım sadece bu testleri tasarlayanlar ve okul yöneticileri için tatmin edici olabilir ama aynı zamanda Deep Mind’ın iddiasının da temelidir. Hepimiz şu testleri yaptık: SAT’ler, GRE’ler, 6. sınıftan (sanırım) SRE denilen o test kutusu. Oldukça benzerler: Okuyucu bir belgeden gerçekleri çıkarabilir mi? Jack tepeye doğru yürüdü. Tepeye çıkarken Jill Jack’in yanındaydı. Bir kova su getirdiler: bu tür şeyler.


Zeka ve Anlama – O'Reilly

Daha hızlı öğrenin. Daha derin kaz. Daha uzağa bakın.

Bu birinci sınıf anlama, lise değil, ancak tek gerçek fark, yaşlandıkça metinlerin ve gerçeklerin daha karmaşık hale gelmesidir. Bir LLM’nin bu tür bir gerçek çıkarımı gerçekleştirebilmesi benim için hiç de şaşırtıcı değil. Milyarlarca parametre ve terabaytlarca eğitim verisi olmadan oldukça iyi bir iş çıkarmanın mümkün olduğundan şüpheleniyorum (naif olmama rağmen). Bu performans düzeyi faydalı olabilir, ancak ben buna “anlama” demek konusunda isteksizim. Faulkner’ın dediği gibi, birinin bir edebiyat eserini anladığını söylemekte isteksiz oluruz. Ses ve öfke, tüm yaptıkları gerçekleri çıkarmak olsaydı: Quentin öldü. Dilsey direndi. Benjy hadım edildi.

Anlama, yapay zeka tartışmalarında sıklıkla ortaya çıkan birçok terim gibi, zayıf tanımlanmış bir terimdir: zeka, bilinç, kişilik. Mühendisler ve bilim adamları, kötü tanımlanmış, belirsiz terimlerden rahatsız olma eğilimindedir. Hümanistler değildir. İlk önerim, bu terimlerin tam olarak iyi tanımlanmadıkları için önemli oldukları ve kesin tanımların (başladığım işlemsel tanım gibi) onları kısırlaştırdığı, işe yaramaz hale getirdiğidir. Ve belki de burada anlamanın daha iyi bir tanımına başlamamız gerekir: bir metne veya söze yanıt verme yeteneği olarak.

Bu tanımın kendisi belirsizdir. Bir yanıttan ne anlamalıyız? Bir yanıt, bir ifade (bir LLM’nin sağlayabileceği bir şey) veya bir eylem (bir LLM’nin yapamayacağı bir şey) olabilir. Bir yanıtın onay, anlaşma veya uyumluluğu göstermesi gerekmez; tek yapması gereken sözcenin anlamlı bir şekilde işlendiğini göstermektir. Örneğin, bir köpeğe veya çocuğa “otur” diyebilirim. Hem köpek hem de çocuk “oturabilir”; aynı şekilde, ikisi de oturmayı reddedebilir. Her iki yanıt da anlamayı gösterir. Elbette anlamanın dereceleri vardır. Ayrıca bir köpeğe veya çocuğa “ödev yapmasını” söyleyebilirim. Bir çocuk ya ödevini yapabilir ya da reddedebilir; bir köpek ödevini yapamaz, ama bu reddetme değil, bu anlamamadır.

Burada önemli olan, itaat etmeyi reddetmenin (yetersizliğin aksine) neredeyse uyum kadar iyi bir kavrayış göstergesi olmasıdır. Reddetme, anlamama ve yetersizlik arasında ayrım yapmak her zaman kolay olmayabilir; biri (hem insanlar hem de köpekler dahil) bir talebi anlayabilir, ancak yerine getiremeyebilir. “Ödevimi yapmamı söyledin ama öğretmen ödevi göndermedi” “Ödevimi yapmamı söyledin ama flüt çalışmak daha önemli çünkü konser yarın” den farklıdır, ancak her iki yanıt da anlamayı gösterir. Ve her ikisi de bir köpeğin “Ödevimi yapmamı söyledin, ama ben ödevin ne olduğunu anlamıyorum” sözünden farklıdır. Tüm bu durumlarda, anlama gerektiren bir şeyi yapmak (ya da yapmamak) ile bir şeyi yapamamak arasında bir ayrım yaparız, bu durumda ya anlamak ya da anlamamak mümkündür, ancak uyum mümkün değildir.

Bu da bizi daha önemli bir konuya getiriyor. Yapay zekadan (veya genel zekadan) bahsederken, karmaşık bir şey yapmayı (örneğin bir şampiyonluk seviyesinde Satranç veya Go oynamak gibi) zeka ile karıştırmak kolaydır. Daha önce tartıştığım gibi, bu deneyler bize zekanın ne olduğundan çok ne olmadığını gösteriyor. Burada gördüğüm şey, zekanın aşırı hareket etme yeteneğini içerdiğidir: birisi “otur” dediğinde oturmamaya karar verme yeteneği.1

Oturmamaya karar verme eylemi bir tür düşünmeyi, bir tür seçimi ima eder: irade ya da irade. Yine, tüm zeka eşit yaratılmamıştır. Bir çocuğun zeki olabileceği (ev ödevi) bir köpeğin yapamayacağı şeyler vardır; ve eğer uzlaşmaz bir çocuktan “oturmasını” istediyseniz, basit bir komut gibi görünen şeyi belirsiz hale getiren birçok alternatif “oturma” yolu bulabilirler. Çocuklar Dostoyevski’nin romanının mükemmel tercümanlarıdır Yeraltından NotlarAnlatıcının, yalnızca bunu yapma özgürlüğüne sahip olduğunu kanıtlamak için kendi çıkarlarına aykırı hareket ettiği, onun için eylemlerinin sonuçlarından daha önemli olan bir özgürlük. Daha da ileri gidecek olursak, bir fizikçinin zeki olabileceği, ancak bir çocuğun yapamayacağı şeyler vardır: örneğin bir fizikçi, Newton’un hareket yasalarını yeniden düşünmeye ve genel göreliliği bulmaya karar verebilir.2

Verdiğim örnekler iradenin, iradenin önemini gösteriyor. Bir yapay zeka, şampiyonluk seviyesindeki insanları yenerek Satranç veya Go oynayabilir, ancak Satranç veya Go oynamak istediğine karar veremez. Bu, Searls’ın eksik bir bileşenidir. Çin Odası Düşünce deneyi. Searls, Çince sembollerle dolu kutular ve Çince’yi tercüme etmek için bir algoritma bulunan bir odada bir insan hayal etti. Odanın dışındaki insanlar Çince yazılmış soruları iletirler ve odadaki kişi doğru cevaplar hazırlamak için bir sembol kutusu (veritabanı) ve bir algoritma kullanır. Bu kişinin Çince’yi “anladığını” söyleyebilir miyiz? Buradaki önemli soru, kişinin aynı algoritmayı izleyen bir bilgisayardan ayırt edilemez olup olmadığı değildir. Bana çarpan şey, ne bilgisayarın ne de insanın Çince konuşmaya karar verebilecek durumda olmaması. Yalnızca girdilere yanıt verirler ve hiçbir zaman herhangi bir irade göstermezler. (Aynı derecede ikna edici bir irade gösterisi, Çinlileri doğru bir şekilde konuşmayı reddeden bir bilgisayar ya da insan olabilir.) LLM’lerin birçok kişiyle ilginç “konuşmalar” yaptığı (Agüera y Arcas’ dahil) gösterileri olmuştur. bir insan, ancak bilgisayarın konuşmayı başlattığı veya bir konuşma yapmak istediğini gösteren hiçbiri. İnsanlar yapar; İlk günden beri, ne zaman olursa olsun, hikaye anlatıcılarıyız. Hikaye anlatıcıları, belirsizliği kullananlar ve yalancılar olduk. Hikayeler anlatıyoruz çünkü yapmak istiyoruz.

Kritik unsur budur. Zeka iradeyle, iradeyle, bir şeyler yapma arzusuyla bağlantılıdır. “Yapma arzunuz” olduğu yerde, “yapmama arzunuz” da vardır: karşı çıkma, itaatsizlik etme, ihlal etme yeteneği. “Zihin kontrolü” kinayesinin bilimkurgu ve politik propagandadaki en korkutucu şeylerden biri olması hiç de şaşırtıcı değil: bu, temelde insan olarak gördüğümüz şeye doğrudan bir meydan okumadır. “İtaatsiz bilgisayar”ın da bu korkunç mecazlardan biri olması şaşırtıcı değildir, çünkü bilgisayar bizden üstün olduğu için değil, itaatsizlik ederek insan olduğu için.

İradenin yokluğunu temel bir sınırlama olarak görmüyorum. İrade kendisi olmasa bile, istenci simüle eden bir şeyi programlamanın imkansız olduğuna kesinlikle bahse girmem (temelde belirsiz olan bu terimlerden bir diğeri). Mühendislerin ve AI araştırmacılarının yapması gerekip gerekmediği farklı bir sorudur. İradeyi, mevcut modellerimizin yapamadığı, “zekanın” temel bir bileşeni olarak anlamak, “etik AI” tartışmalarımızın gerçekten AI ile ilgili olmadığı anlamına gelir; AI araştırmacıları ve geliştiricileri tarafından yapılan seçimlerle ilgilidir. Etik, seçim yapabilen varlıklar içindir. İhlal etme yeteneği zekanın önemli bir bileşeniyse, araştırmacıların “itaatsiz bilgisayar” kinayesini ciddiye alıp almamayı seçmeleri gerekecek. Başka bir yerde, varsayımsal bir yapay genel zekanın tüm insanları öldürmeye karar verip vermeyeceğiyle ilgilenmediğimi söyledim. İnsanlar birçok durumda soykırım yapmaya karar verdiler, bir YGZ’nin mantıklı bulmayacağına inandığım bir şey. Ancak, “zeka”nın, insanın aşırı davranabilme yeteneğini içerdiği bir bilgisayar olabilir.

Ve bu beni bu makalenin garip başlangıcına geri getiriyor. Aslında, son zamanlarda AI hakkında pek bir şey yazmadım. Bu makaleyi yazarken olduğu gibi bu bir seçimdi. Bir LLM bunu yazmış olabilir mi? Muhtemelen, doğru yönde ilerlemesini sağlamak için uygun istemlerle. (Bu tam olarak Çin Odası gibi.) Ama ben bu yazıyı yazmayı seçtim. Bu seçme eylemi, en azından mevcut teknolojimizle, bir LLM’nin asla yapamayacağı bir şeydir.


Dipnotlar

  1. fikrinden hiç bu kadar etkilenmedim somutlaşmış zeka– bu zeka, bir vücut bağlamını ve duyusal girdiyi gerektirir. Bununla birlikte, buradaki argümanlarım, kredi vermediğim şekillerde bir şeyin üzerinde olduğunu gösteriyor. “Oturmak” beden olmadan anlamsızdır. Fizik gözlem olmadan imkansızdır. Stres, vücudun ihtiyaç duyduğu bir tepkidir. Ancak Blaise Agüera y Arcas, Google’ın modelleriyle “favori bir adadan” bahsettikleri ve “koku alma duyusuna” sahip olduklarını iddia ettikleri “konuşmalar” yaptı. Bu ihlal mi? hayal gücü mü? “Cisimlenme” fiziksel bir yapıdan ziyade sosyal bir yapı mıdır? Burada çok fazla belirsizlik var ve tam da bu yüzden önemli. Bir beden olmadan günah mümkün mü?
  2. “Büyük adam” ilerleme teorisinden uzaklaşmak istiyorum; gibi Ethan Siegel tartıştı inandırıcı bir şekilde, eğer Einstein hiç yaşamamış olsaydı, fizikçiler muhtemelen Einstein’ın buluşlarını nispeten kısa bir sırada yapmış olacaklardı. Eşiğindeydiler ve birçoğu aynı çizgide düşünüyordu. Yine de bu benim argümanımı değiştirmiyor: genel göreliliği bulmak için, Newton fiziğinde ters giden bir şeyler olduğunu, çoğu insanın “yasa” olarak kabul ettiği bir şey olduğunu ve bu salt rızanın ileriye dönük bir yol olmadığını anlamalısınız. Köpekler, çocuklar veya fizikçiler hakkında konuşalım, zeka sınır tanımaz.




Kaynak : https://www.oreilly.com/radar/intelligence-and-comprehension/

Yorum yapın

SMM Panel PDF Kitap indir