Amazon, re:MARS’ta ortam ve genelleştirilebilir zekayı araştırıyor


Transform 2022’yi 19 Temmuz’da ve neredeyse 20 – 28 Temmuz’da geri getirmekten heyecan duyuyoruz. Bilgili görüşmeler ve heyecan verici ağ oluşturma fırsatları için yapay zeka ve veri liderlerine katılın. Bugün kayıt Ol!


“Genelleştirilebilir zekaya” giden yol -yani, çoğu kişinin bilimkurgu olarak gördüğü şey- çevresel zeka ile başlar. Ve bu gelecek şimdi ortaya çıkıyor.

Amazon’da Alexa kıdemli başkan yardımcısı ve baş bilim adamı Rohit Prasad, “Hayallerin ve bilim kurgunun gerçeğe dönüştüğü AI’nın altın bölgesinde yaşıyoruz” dedi.

Prasad, bugün çevre zekasından genelleştirilebilir zekaya (GI) evrim hakkında konuştu. yeniden: MARS, Amazon’un makine öğrenimi, otomasyon, robotik ve uzay konulu konferansı.

Prasad’ın dediğine göre, ortam zekası, altta yatan yapay zekanın her yerde mevcut olduğunda, ihtiyaç duyduklarında insanlara yardım ettiğinde – ve ayrıca ihtiyaçları tahmin etmeyi öğrendiğinde – daha sonra ihtiyaç duyulmadığında arka planda kaybolduğunda ortaya çıkıyor.

Prasad, birincil bir örnek ve GI’ye yönelik önemli bir adımın “kişisel asistan, danışman, yol arkadaşı” olarak tanımladığı Amazon’un Alexa’sı olduğunu söyledi.

Sanal asistan, çeşitli duyusal sinyalleri işleyen 30 ML sistemiyle donatıldığını açıkladı. Düzinelerce ülkede 17 dilde haftada 1 milyardan fazla istek alıyor. Ayrıca, Ağustos ayında fırlatılacak olan mürettebatsız Artemis 1 misyonunun bir parçası olarak aya yönlendirileceğini söyledi.

Gelecekteki bir Alexa özelliği, kısa ses kliplerini daha uzun konuşmalarla sentezleyebilecek. Prasad, ölen bir büyükannenin torununa yatmadan önce bir hikaye okumasını örnek verdi.

“Bu, saatlerce kayıt yerine bir dakikadan daha az kayıtla yüksek kaliteli bir ses üretmeyi öğrenmemiz gereken icatlar gerektiriyordu” dedi. Sorunu “bir konuşma oluşturma yolu değil, bir ses dönüştürme görevi olarak” çerçevelemeyi içerdiğini de sözlerine ekledi.

ortam zekası reaktif, proaktif, öngörücü

Prasad’ın açıkladığı gibi, ortam zekası hem reaktif (doğrudan isteklere yanıt verir) hem de proaktiftir (ihtiyaçları tahmin eder). Bunu çok sayıda algılama teknolojisinin kullanımıyla gerçekleştirir: görüntü, ses, ultrason, derinlik, mekanik ve atmosferik sensörler. Daha sonra bunlar üzerinde işlem yapılır.

Tümüyle, bu yetenek, doğal dil işlemenin (NLP) yanı sıra derin öğrenme yetenekleri gerektirir. Ortam zekası “aracıları” aynı zamanda kendi kendini denetleyen ve kendi kendine öğrenendir; bu, öğrendiklerini genelleştirmelerine ve bunu yeni bağlamlara uygulamalarına olanak tanır.

Örneğin, Alexa’nın kendi kendine öğrenme mekanizması, haftada on milyonlarca hatayı otomatik olarak düzeltir, dedi – bu hem müşteri hatalarını hem de kendi doğal dil anlama (NLU) modellerindeki hataları.

Bunu, GI’ye giden “en pratik” yol veya AI varlıklarının insanların yapabileceği herhangi bir entelektüel görevi anlama ve öğrenme yeteneği olarak tanımladı.

Prasad, nihayetinde, “ortam zekası yolunun genelleştirilmiş zekaya yol açmasının nedeni budur” dedi.

GI ajanları gerçekte ne yapar?

Genelleştirilebilir zekanın üç özelliği vardır. GI “aracıları”, minimum dış insan girdisi ile birden fazla görevi yerine getirebilir, değişen ortamlara dönüşebilir ve yeni kavramlar ve eylemler öğrenebilir.

GI ayrıca önemli miktarda sağduyu gerektirir. Alexa bunu zaten sergiliyor, dedi: Bir kullanıcı Super Bowl için bir hatırlatıcı ayarlamak isterse, örneğin, büyük oyunun tarihini belirlerken aynı zamanda kendi saat dilimine dönüştürür, ardından başlamadan önce onlara hatırlatacaktır. Ayrıca rutinleri önerir ve “önseziler” özelliği sayesinde anormallikleri tespit eder.

Yine de, GI herhangi bir görevi yerine getirebilecek “her şeyi bilen, her şeye kadir” bir teknoloji olmadığını vurguladı.

“Biz insanlar hala genellemenin en iyi örneğiyiz ve yapay zekanın arzuladığı standartız” dedi.

GI zaten gerçekleştiriliyor, dikkat çekti: Kendi kendini denetleme ile eğitilmiş temel dönüştürücü tabanlı büyük dil modelleri, birçok görevi her zamankinden çok daha az manuel olarak etiketlenmiş verilerle güçlendiriyor. Bunun bir örneği, NLU, konuşma tanıma, diyalog tahmini ve görsel sahne anlayışından bilgi toplayan Amazon’un Alexa Öğretmen Modelidir.

Amaç, otomatik akıl yürütmeyi yeni zirvelere çıkarmak, ilk hedefin konuşma yapay zekasında sağduyu bilgisinin “yaygın kullanımı” olduğunu söyledi.

Bunun için çalışırken Amazon, açık alan sohbetinde araştırmaya yardımcı olmak için 11.000’den fazla yeni toplanmış diyalog içeren sağduyu bilgisi için bir veri seti yayınladı.

Şirket ayrıca “konuşmadan önce düşün” olarak kabul ettiği üretken bir yaklaşım da icat etti. Bu, yapay zeka aracısının örtük sağduyu bilgisini dışsallaştırmayı (“düşünmeyi”) ve sağduyu bilgi grafiğiyle birleştirilmiş geniş bir dil modelini (serbestçe kullanılabilen semantik ağ ConceptNet gibi) kullanmayı öğrenmesini içerir. Daha sonra bu bilgiyi yanıtlar üretmek (“konuşmak”) için kullanır.

Amazon ayrıca Alexa’yı birden fazla çıkarım adımı gerektiren karmaşık sorguları yanıtlaması için eğitiyor ve aynı zamanda kullanıcıların web’i keşfetmek için telefonlarını veya dizüstü bilgisayarlarını çıkarmak zorunda kalmamaları için ortam cihazlarında “konuşma keşifleri” sağlıyor.

Prasad, bu yeteneğin derin öğrenme yoluyla diyalog akışı tahmini gerektirdiğini söyledi; web ölçeğinde sinirsel bilgi alımı; ve birden çok kaynaktan gelen bilgileri damıtabilen otomatik özetleme.

Alexa Konuşmaları diyalog yöneticisi, Alexa’nın etkileşim, diyalog geçmişi, mevcut girdiler ve sorgular, sorgu yönlendirmeli ve kendi kendine dikkat mekanizmalarına dayalı olarak hangi eylemleri yapması gerektiğine karar vermesine yardımcı olur. Sinirsel bilgi alımı, milyarlarca veri noktasına dayalı olarak farklı yöntemlerden ve dillerden bilgi çeker. Farklı veri kaynakları için optimize edilmiş çok aşamalı bir paradigma kullanılarak eğitilen transformatör tabanlı modeller, sorguları ilgili bilgilerle anlamsal olarak eşleştirmeye yardımcı olur. Derin öğrenme modelleri, kritik bilgileri tutarken kullanıcılar için bilgileri damıtır.

Prasad, teknolojiyi çok görevli, çok dilli ve çok modlu olarak tanımladı ve “daha ​​doğal, insan benzeri konuşmalara” izin verdi.

Nihai hedef, AI’yı yalnızca günlük yaşamlarında müşteriler için faydalı kılmak değil, aynı zamanda basit hale getirmektir. Sezgiseldir, onu kullanmak isterler ve hatta ona güvenmeye başlarlar. Konuşmadan önce düşünen, sağduyulu bilgi grafikleriyle donatılmış ve açıklanabilirlik yoluyla yanıtlar üretebilen, başka bir deyişle, her zaman basit olmayan soruları ve yanıtları işleme yeteneğine sahip olan yapay zekadır.

Prasad, “AI eskisinden daha iyi genelleştirebildiğinden, nihayetinde yapay zeka gün geçtikçe daha fazla gerçekleştirilebilir hale geliyor” dedi.

Perakende için, AI sadece çekip gitmeyi öğrenir

Amazon ayrıca, Amazon Go mağazalarında fütüristik avuç içi tarama ve akıllı arabalar gibi yetenekler aracılığıyla fiziksel perakendeyi “yeniden icat etmek” için ML ve AI kullanıyor. Fiziksel perakende ve teknolojiden sorumlu başkan yardımcısı Dilip Kumar, bunun “sadece çekip gitme” becerisini mümkün kıldığını söyledi.

Kumar, şirketin fiziksel mağazalarından ilkini Ocak 2018’de açtı. Kumar, bu mağazaların 1.800 metrekarelik rahat stilden 40.000 metrekarelik bakkal stiline dönüştüğünü söyledi. Şirket, 2020 yazında Dash Cart ve 2020 sonbaharında Amazon One ile bunları geliştirdi.

Gelişmiş bilgisayarlı görme yetenekleri ve ML algoritmaları, insanların bir mağazaya girdiklerinde avuçlarını taramalarına, ürünleri almalarına, sepetlerine eklemelerine ve ardından dışarı çıkmalarına olanak tanır.

Kumar, el hareketinin kasıtlı ve sezgisel olması gerektiği için seçildiğini açıkladı. Avuç içi, müşterinin kredi veya banka kartı bilgileriyle ilişkilendirilir ve doğruluk, kısmen damar bilgilerinin yüzey altı görüntüleri aracılığıyla sağlanır.

Kumar, “Bu, yüz tanımanın yapabileceğinden daha büyük bir düzeyde doğruluk sağlar” dedi.

Bu arada arabalar, belirli öğeleri ve öğelerin sayısını tanımlayan ağırlık sensörleriyle donatılmıştır. Gelişmiş algoritmalar aynı zamanda artan “toplama ve iade” karmaşıklığının üstesinden gelebilir – veya bir müşteri bir ürünle ilgili fikrini değiştirdiğinde – ve ortam gürültüsünü ortadan kaldırabilir.

Kumar, bu algoritmaların yerel olarak mağaza içinde, bulutta ve uçta çalıştırıldığını açıkladı. “Ortama bağlı olarak karıştırıp eşleştirebiliriz” dedi.

Amaç, müşterilerin alışverişe odaklanabilmeleri için “bu teknolojinin tamamen arka plana çekilmesini sağlamak” dedi. “Bütün bu karmaşıklığı müşterilerden sakladık” dedi, böylece “alışveriş deneyimlerine, misyonlarına kendilerini kaptırabilirler”.

Benzer şekilde, şirket ilk Amazon Style mağazasını Mayıs 2022’de açtı. Mağazaya girdikten sonra müşteriler, mağaza katında otomatik olarak soyunma odalarına veya teslim alma masalarına gönderilen ürünleri tarayabilir. Ayrıca ek satın alma önerileri de sunulur.

Nihayetinde Kumar, “keşifimizde çok erken, ML’nin sınırlarını zorluyoruz. Önümüzde bir sürü yenilik var.”

VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji ve işlemler hakkında bilgi edinmeleri için dijital bir şehir meydanı olmaktır. Üyelik hakkında daha fazla bilgi edinin.


Kaynak : https://venturebeat.com/2022/06/22/amazon-digs-into-ambient-and-generalizable-intelligence-at-remars/

Yorum yapın

SMM Panel