AI neden sürekli bir sentetik veri diyetine ihtiyaç duyar?


Vatandaş geliştiricilerin becerilerini artırarak ve ölçeklendirerek başarılı bir şekilde yenilik yapmayı ve verimliliğe nasıl ulaşılacağını öğrenmek için Low-Code/No-Code Summit’teki isteğe bağlı oturumlara göz atın. İzle şimdi.


Yapay zeka (AI) bildiğimiz dünyayı yiyor olabilir, ancak uzmanlar AI’nın kendisinin de açlıktan ölmek üzere olduğunu ve diyetini değiştirmesi gerektiğini söylüyor. Bir şirket, sentetik verilerin yanıt olduğunu söylüyor.

Sentetik veri platformu sağlayıcısı CEO’su ve kurucu ortağı Kevin McNamara, “Veriler yapay zeka için besindir, ancak bugün yapay zeka yetersiz ve yetersiz besleniyor,” dedi. Paralel Alan, Hangi sadece kabarık March Capital liderliğindeki B serisi turda 30 milyon dolar. “Bu yüzden işler yavaş büyüyor. Ancak bu yapay zekayı daha iyi besleyebilirsek, modeller daha hızlı ve daha sağlıklı bir şekilde büyüyecektir. Sentetik veriler, yapay zekayı eğitmek için besin gibidir.”

Araştırmalar göstermiştir ki, yaklaşık %90 yapay zeka ve makine öğrenimi (ML) dağıtımlarının yüzdesi başarısız oluyor. A Datagen Bu yılın başlarından gelen rapor, birçok başarısızlığın eğitim verilerinin eksikliğinden kaynaklandığına işaret etti. Bilgisayarla görme uzmanlarının %99’unun, bir makine öğrenimi projesinin, onu tam olarak görecek veri eksikliği nedeniyle özellikle iptal edildiğini söylediğini tespit etti. Ankete katılanların %100’ü, veri eksikliği nedeniyle tamamen iptal edilmeyen projelerde bile önemli gecikmeler yaşandığını ve onları yoldan çıkardığını bildirdi.

Bu doğrultuda Gartner, sentetik verilerin yapay zeka ve makine öğrenimi eğitim amaçları için giderek artan bir şekilde ek olarak kullanılacağını tahmin ediyor. Araştırma devi, 2024 yılına kadar sentetik verilerin hızlandırmak için kullanılacağını öngörüyor 60% yapay zeka projelerinin sayısı.

Etkinlik

Akıllı Güvenlik Zirvesi

Yapay zeka ve makine öğreniminin siber güvenlikteki kritik rolünü ve sektöre özel vaka incelemelerini 8 Aralık’ta öğrenin. Ücretsiz geçişiniz için bugün kaydolun.

Şimdi üye Ol

Sentetik veriler, davranış kalıpları üzerinde eğitim vermek ve orijinal veri kümesinin istatistiksel özelliklerini koruyan simüle edilmiş veriler oluşturmak için gerçek verileri alan makine öğrenimi algoritmaları tarafından üretilir. Ortaya çıkan veriler, gerçek dünya koşullarını kopyalar, ancak standart anonimleştirilmiş veri kümelerinin aksine, gerçek verilerle aynı kusurlara karşı savunmasız değildir.

Yapay Zekayı ‘Taş Devri’nden Çıkarmak

Yapay zeka kadar gelişmiş bir teknolojinin bir tür “Taş Devri”nde sıkışıp kaldığını duymak kulağa alışılmadık gelebilir, ancak McNamara’nın gördüğü şey bu ve sentetik veriler benimsenmeden bu şekilde kalacağını söylüyor.

“Şu anda yapay zeka gelişimi, insanların delikli kart programlamayı kullandığı 60’larda veya 70’lerde bilgisayar programlamanın olduğu gibi – manuel, emek yoğun bir süreç” dedi. “Eh, dünya sonunda bundan uzaklaştı ve dijital programlamaya geçti. Bunu AI gelişimi için yapmak istiyoruz.”

McNamara’ya göre yapay zekayı Taş Devri’nde tutan en büyük üç darboğaz şunlardır:

  1. Gerçek dünya verilerini toplama – ki bu her zaman mümkün değildir. Algoritmanızı eğitmek için milyonlarca örneğe ihtiyacınız varsa, kırmızı ışıkta geçme gibi bir şey için bile, dünyanın dört bir yanındaki şehirlerde oldukça sık meydana gelir ve bu, şirketler için dışarı çıkıp gerçek dünyadan almak için hızla ulaşılamaz hale gelir.
  2. etiketleme – bu genellikle binlerce saatlik insan zamanı gerektirir ve yanlış olabilir, çünkü insanlar hata yapar.
  3. Veriler üzerinde yineleme etiketlendikten sonra – bu, sensör yapılandırmalarını vb. ayarlamanızı ve ardından yapay zekanızı gerçekten eğitmeye başlamak için uygulamanızı gerektirir.

McNamara, “Bütün bu süreç çok yavaş,” dedi. “Bunları gerçekten hızlı bir şekilde değiştirebilirseniz, daha en başta yapay zekanızı geliştirmenin daha iyi kurulumlarını ve daha iyi yollarını keşfedebilirsiniz.”

Sahneyi sağdan girin: Sentetik veriler

Parallel Domain, gerçek dünya senaryolarının ve coğrafyalarının “dijital kuzenleri” olarak adlandırdığı haritalara dayalı sanal dünyalar üreterek çalışır. Bu dünyalar, örneğin, otonom araçların eğitimine yardımcı olmak için daha fazla kırmızı ışıkta geçme veya yağmura sahip olacak şekilde değiştirilebilir ve manipüle edilebilir.

Parallel Domain'in sanal dünya yeteneklerinin harita görünümünü gösteren yapay verilerinin bir örneği.
Parallel Domain’in sanal dünya yeteneklerinin harita görünümünü gösteren yapay verilerinin bir örneği.

Dünyalar dijital ikizler değil, dijital kuzenler olduğundan, özelleştirme bazen elde edilmesi daha zor olan ancak eğitim için gerekli olan ve şirketlerin normalde dışarı çıkıp kendilerinin alması gereken verileri simüle edebilir. Platform, kullanıcıların bir API aracılığıyla ihtiyaçlarına göre uyarlamasına olanak tanır, böylece faktörleri tam olarak istedikleri şekilde taşıyabilir veya manipüle edebilirler. Bu, AI eğitim sürecini hızlandırır ve zaman ve iş gücü engellerini ortadan kaldırır.

Şirket, Toyota Araştırma Enstitüsü, Google, Continental ve Woven Planet gibi müşterilerinin kullanımına hazır eğitim veri kümelerini birkaç saat içinde sağlayabileceğini iddia ediyor.

McNamara, “Müşteriler simüle edilmiş dünyaya gidebilir ve bir şeyler gerçekleştirebilir veya o dünyadan veri çekebilir” dedi. “Farklı türde varlık kategorileri ve gerçekleşebilecek senaryolar için düğmelerimiz ve ayrıca müşterilerin gördükleri şey, nerede gördükleri ve bu şeylerin nasıl davrandıkları konusunda kendi mantıklarını kullanma yollarımız var.”

Ardından, müşterilerin o dünyadan kendi kurulumlarıyla eşleşen yapılandırmaya veri çekmek için bir yola ihtiyaçları olduğunu açıkladı.

“Sensör yapılandırma araçlarımız ve etiket yapılandırma araçlarımız, bir müşterinin göreceği tam kamera kurulumunu veya tam olarak lidar ve radar ve etiketleme kurulumunu kopyalamamıza olanak tanıyor” dedi.

Sentetik veriler, üretici yapay zeka

Sentetik veriler yalnızca yapay zeka ve makine öğrenimi modeli eğitimi için yararlı olmakla kalmaz, aynı zamanda teknolojinin halihazırda hızla büyüyen bir kullanımı olan üretken yapay zekanın daha da hızlı gelişmesini sağlamak için uygulanabilir.

Şirket 2023’e yeni sermaye ile girerken Parallel Domain sahaya bakıyor. Üretken yapay zekanın eğitmesi gereken verileri çoğaltmayı umuyor, böylece içerik oluşturma için daha da güçlü bir araç haline gelebilir. Ar-Ge ekibi, sunabileceği sentetik veri simülasyonlarında çeşitlilik ve ayrıntıya odaklanıyor.

McNamara, “Alanımızdaki üretken yapay zeka beni heyecanlandırıyor,” dedi. “Dünyanın sanatsal bir yorumunu yaratmak için burada değiliz. Aslında dünyanın dijital bir kuzenini yaratmak için buradayız. Üretken yapay zekanın dünyanın dört bir yanından görüntü örneklerine bakma ve ardından bunları çekip sentetik verilerin içinde ilginç örnekler ve yeni bilgiler oluşturma konusunda gerçekten güçlü olduğunu düşünüyorum. Bu nedenle, üretken yapay zeka, önümüzdeki yıl yatırım yapacağımız teknolojik gelişmelerin büyük bir parçası olacak.”

Sentetik verilerin değeri yapay zeka ile sınırlı değildir. Gerçekçi sanal ortamlar oluşturmak için gereken çok miktarda veri göz önüne alındığında, meta veri deposunu ileriye taşımak için tek pratik yaklaşım da budur.

Parallel Domain, hızla büyüyen sentetik veri başlatma sektörünün bir parçasıdır. Crunchbase daha önce bildirildiğine göre bir fon alanı görüyor. Datagen, Gretel AI ve Mostly AI, geçen yıl birkaç milyon toplayan rakiplerinden bazıları.

VentureBeat’in misyonu teknik karar vericilerin dönüştürücü kurumsal teknoloji ve işlemler hakkında bilgi edinmeleri için dijital bir kent meydanı olmaktır. Brifinglerimizi keşfedin.


Kaynak : https://venturebeat.com/ai/why-ai-needs-a-steady-diet-of-synthetic-data/

Yorum yapın

SMM Panel PDF Kitap indir