AI görüntüleyici Midjourney v5, fotogerçekçi görüntüler ve 5 parmaklı ellerle sersemletiyor


AI görüntü oluşturucu Midjourney v5'teki aydınlatma ve dış görünüm efektlerine bir örnek.
Büyüt / AI görüntü oluşturucu Midjourney v5’teki aydınlatma ve dış görünüm efektlerine bir örnek.

Çarşamba günü, Midjourney ilan edildi bazı AI sanat hayranlarının aradığı kalite düzeyinde fotogerçekçi görüntüler üretebilen ticari AI görüntü sentezi hizmetinin 5. versiyonu ürpertici Ve “çok mükemmel.” Midjourney v5, Discord aracılığıyla sunulan Midjourney hizmetine abone olan müşteriler için bir alfa testi olarak artık mevcut.

Grafik tasarımcısı Julie Wieland, “MJ v5 şu anda bana, kötü görme yetisini biraz fazla görmezden geldikten sonra nihayet gözlük almak gibi geliyor,” dedi. sık sık paylaşır Twitter’da Midjourney kreasyonları. “Birden her şeyi 4k olarak görüyorsunuz, garip bir şekilde bunaltıcı ama aynı zamanda harika bir duygu.”

Wieland, Midjourney v5 nesillerinden bazılarını Ars Technica ile paylaştı (aşağıda bir galeride ve yukarıdaki ana resimde görülüyor) ve Midjourney’in Mart 2022’de ilk kez gelmesinden bu yana görüntü ayrıntılarında kesinlikle bir ilerleme gösteriyorlar. Sürüm 3, Ağustos’ta piyasaya çıktı ve sürüm 4, Kasım ayında giriş yaptı. Deneylerimizin gösterdiği gibi, her yineleme, oluşturulan sonuçlara daha fazla ayrıntı ekledi:

Bilgi istemi ile Midjourney v3 (sol), v4 (orta) ve v5 (sağ) çıktıları arasında bir karşılaştırma
Büyüt / Midjourney v3 (solda), v4 (ortada) ve v5’ten (sağda) çıktı ile “bir CRT televizyon setinin yanında, sinematik, 8K, stüdyo aydınlatmasının yanında silahları olan kaslı bir barbar” karşılaştırması.

Ars Teknik

Midjourney, milyonlarca insan yapımı sanat eseri üzerinde eğitilmiş bir yapay zeka modeli kullanarak “bilgi istemleri” adı verilen metin açıklamalarına dayalı görüntüler oluşturması açısından Stable Diffusion ve DALL-E gibi görüntü sentezleyicilere benzer şekilde çalışır. Son zamanlarda Midjourney, hizmetin önceki sürümlerini kullanan bir çizgi romanla ilgili bir telif hakkı tartışmasının merkezinde yer alıyordu.

Bir gün boyunca v5 ile deney yaptıktan sonra Wieland, “inanılmaz derecede gerçekçi” cilt dokuları ve yüz özelliklerini içeren iyileştirmeler kaydetti; daha gerçekçi veya sinematik aydınlatma; daha iyi yansımalar, parlamalar ve gölgeler; bir sahnenin daha anlamlı açıları veya genel bakışları ve “neredeyse mükemmel ve artık sakat olmayan gözler.”

Ve tabii ki eller.

Geçen yıl boyunca, yapay zeka sanat oluşturucularının elleri doğru bir şekilde işleyemediği fikri, kültürel kinaye. Özellikle, Midjourney v5, oldukça iyi gerçekçi insan eli üretebilir. Wieland, “Eller çoğu zaman doğrudur, bir elde 7-10 yerine 5 parmak vardır” dedi.

Hizmetin Discord sürüm notlarında Midjourney, v5’in artık sürüm 4’ten “çok daha geniş bir stil aralığı” ile yanıt verdiğini, aynı zamanda istemlere karşı daha duyarlı olduğunu, daha az istenmeyen metin ürettiğini ve görüntü çözünürlüğünde 2 kat artış sunduğunu da belirtti.

AI sanat hayranları için Midjourney yükseltmesinin görsel bir dezavantajı varsa, bu belki de o kadar gerçekçi ve “mükemmel” olabilen görüntülerden geliyor ki, modelin hassasiyeti, uygun bir sonuç bulmak için art arda AI görüntüleri oluşturmanın heyecanını ortadan kaldırıyor. “slot makinesi etkisi” denilebilir. Philipp Lenssen adında bir Twitter kullanıcısı olmasına rağmen kayıt edilmiş“Aklınızda belirli bir resim konusu varsa, bu yine de biraz piyangoya benzer. Ancak v4’ten daha yüksek kazanma şansıyla.”




Kaynak : https://arstechnica.com/?p=1924539

Yorum yapın

SMM Panel PDF Kitap indir