Nvidia, büyük dilli modellerin eğitimi için yeni hizmetler başlattı • TechCrunch


Nvidia, büyük dilli modellerin eğitimi için yeni hizmetler başlattı • TechCrunch

Büyük AI modellerine, özellikle de OpenAI’nin GPT-3’ü gibi büyük dilli modellere (LLM’ler) olan ilgi arttıkça, Nvidia, kurumsal yazılım geliştiricilere yönelik, tamamen yönetilen, bulut destekli yeni hizmetlerle nakit para kazanmaya çalışıyor. Bugün şirketin sonbahar 2022 GTC konferansında Nvidia, metin oluşturma ve özetleme, protein yapısı tahmini ve daha fazla.

Yeni teklifler, Nvidia’nın konuşmalı AI için açık kaynaklı bir araç seti olan NeMo’nun bir parçası ve geliştiricilerin LLM’leri sıfırdan oluşturma ihtiyacını en aza indirecek ve hatta ortadan kaldıracak şekilde tasarlandı. Yeni bir model olan Google’ın PaLM’si ile LLM’lerin geliştirilmesi ve eğitilmesi genellikle pahalıdır. tahmini Herkese açık bulut bilişim kaynaklarından yararlanarak 9 milyon ila 23 milyon dolar.

Nvidia, geliştiricilerin NeMo LLM Hizmetini kullanarak, özel verilerle 3 milyardan 530 milyar parametreye kadar değişen modelleri dakikalar veya saatler içinde oluşturabileceğini iddia ediyor. (Parametreler, modelin geçmiş eğitim verilerinden öğrenilen parçalarıdır – başka bir deyişle, modelin tahminlerini bildiren değişkenler, ürettiği metin gibi.) Modeller, Nvidia’nın geliştiricilere izin verdiğini söylediği hızlı öğrenme adı verilen bir teknik kullanılarak özelleştirilebilir. Birkaç yüz örnek kullanarak belirli, sektöre özel uygulamalar için milyarlarca veri noktasıyla eğitilmiş modelleri (örneğin bir müşteri hizmetleri sohbet robotu) uyarlayın.

Geliştiriciler, deneme için özellikler de sunan kodsuz bir “oyun alanı” ortamında modelleri çoklu kullanım durumları için özelleştirebilir. Ayarlanan modeller, dağıtılmaya hazır olduğunda bulut örneklerinde, şirket içi sistemlerde veya bir API aracılığıyla çalışabilir.

BioNeMo LLM Hizmeti, LLM Hizmetine benzer, ancak yaşam bilimleri müşterileri için ince ayarlara sahiptir. Nvidia’nın Clara Discovery platformunun bir parçası ve yakında Nvidia GPU Cloud’da erken erişime sunulacak, Nvidia, kimya ve biyoloji uygulamaları için iki dil modelinin yanı sıra protein, DNA ve kimya verileri için destek içerdiğini söylüyor.

Nvidia LLM'leri

Yapay zeka modelleri tarafından öngörülen biyolojik süreçlerin görselleştirilmesi.

BioNeMo LLM, protein özelliklerini ve fonksiyonlarını tahmin etmek için kullanılabilecek temsiller oluşturmak için amino asit dizilerini işleyen Meta’nın AI Ar-Ge bölümü Meta AI Labs’den bir model de dahil olmak üzere, başlamak için önceden eğitilmiş dört dil modeli içerecektir. Nvidia, gelecekte BioNeMo LLM Hizmetini kullanan araştırmacıların LLM’leri daha yüksek doğruluk için özelleştirebileceklerini söylüyor.

Son araştırmalar, LLM’lerin belirli biyolojik süreçleri tahmin etmede oldukça iyi olduğunu göstermiştir. Bunun nedeni, proteinler gibi yapıların bir tür dil olarak modellenebilmesidir – bir cümle (protein) oluşturmak için bir araya dizilmiş bir sözlük (amino asitler). Örneğin, Salesforce’un Ar-Ge bölümü birkaç yıl önce bir LLM modeli yarattı. ProGen Yapısal olarak, işlevsel olarak canlı protein dizileri üretebilen.

Hem BioNeMo LLM Hizmeti hem de LLM Hizmeti, bir bulut API’si aracılığıyla hazır ve özel modelleri kullanma seçeneğini içerir. Hizmetlerin kullanımı ayrıca müşterilere, geliştiricilerin GPT-3 tipi dil modelleri de dahil olmak üzere bir dizi çok dilli LLM modeli oluşturmasına olanak tanıyan, şimdi açık beta sürümünde olan NeMo Megatron çerçevesine erişim sağlar.

Nvidia, otomotiv, bilgisayar, eğitim, sağlık ve telekomünikasyon markalarının şu anda Çince, İngilizce, Korece ve İsveççe AI destekli hizmetleri başlatmak için NeMo Megatron kullandığını söylüyor.

NeMo LLM ve BioNeMo hizmetleri ile bulut API’lerinin önümüzdeki aydan itibaren erken erişime açılması bekleniyor. NeMo Megatron çerçevesine gelince, geliştiriciler Nvidia’nın LaunchPad pilot platformu aracılığıyla ücretsiz olarak deneyebilir.


Kaynak : https://techcrunch.com/2022/09/20/nvidia-launches-new-services-for-training-large-language-models/

Yorum yapın

SMM Panel PDF Kitap indir