Teknoloji şirketleri yapay zeka alanında ilerlemek için acele ettiği şu günlerde Meta en yeni yapay zeka projesi olan CM3Leon adlı görsel oluşturma aracını duyurdu. Meta, bu modelin, kendi sınıfındaki diğer tüm modellerden daha iyi bir son teknoloji performansa sahip olduğunu bildirdi.

Meta, Telif Hakkı Endişelerini Gidermeyi Amaçlıyor

Yapay zeka programlarını eğitmek için kullanılan telif hakkıyla korunan materyaller, araçların işi hızlandırma ve içerik üretme kapasitelerinin yaygın olarak övülmesine rağmen, birçok tartışmaya konu oldu. Sonuç olarak, içerik oluşturucular tarafından çalışmalarının izinsiz kullanımı için tazminat talep eden bir dizi dava açıldı.

Örneğin, ABD’de komedyen ve yazar Sarah Silverman, Meta ile OpenAI firmalarını, kendisinin izni olmadan yapay zeka modellerini eğitmek için çalışmalarını uygunsuz bir şekilde kullandıkları iddiasıyla dava ediyor.

Bu nedenle, bu işletmelerin tasarımlarıyla telif haklarını ihlal etmeden yollarına devam etmeleri çok önemli. Meta, çalışmasında bunu kabul etti.

CM3Leon’un Özellikleri ve Çok Modlu Yetenekleri

Şirketin İngilizcede bukalemun (chameleon) olarak telaffuz edilen CM3Leon adlı yeni ürünü, telif hakkı endişelerini tamamen ortadan kaldırmak için lisanslı Shutterstock görselleri üzerinde eğitildi.

Model, metin ve resim arasında dönüşüm yapabildiği gibi tam tersini de gerçekleştirebiliyor ve bu da onu çok modlu hale getiriyor. Bu, Meta’ya göre, gelecekteki görüntü anlama modellerinin temelini oluşturan görüntüler için altyazı oluşturma yeteneğine sahip ilk üretken yapay zeka modellerinden biri olmasını sağlıyor.

Konu hakkında açıklama yapan Meta, “CM3Leon’un yetenekleri sayesinde görüntü oluşturma araçları, girdi komutlarını daha iyi takip eden daha tutarlı görüntüler üretebilir. CM3Leon’un çeşitli testlerdeki mükemmel performansını, daha doğru resim üretimi ve anlamaya yönelik bir adım olarak görüyoruz.” ifadelerini kullandı.

Difüzyon ve CM3Leon: Alternatif Bir Yaklaşım

Stable Diffusion, DALL-E ile Midjourney gibi üretken yapay zeka sanat araçlarının yaygınlaşmasıyla birlikte, yapay zeka tarafından üretilen grafikler kavramı iyice yerleşti ve artık yeni veya yenilikçi bir fikir olarak görülmüyor. Bununla birlikte, CM3leon’un geliştirilmesi için Meta tarafından kullanılan teknikler yeni. Bu da Meta’nın temel modelin yapabileceğini iddia ettiği “inanılmaz” performansa yol açıyor.

Kararlı Difüzyon, modern metinden görüntüye üretim sistemlerinde yaygın olarak kullanılan difüzyon modelleri için kullanılan bir terim. CM3leon alternatif bir yöntem olarak token tabanlı bir dönüştürücü modeli kullanıyor.

Meta’nın analizine göre, difüzyon sadece yavaşlığı nedeniyle değil, aynı zamanda yüksek işlem maliyeti nedeniyle çoğu gerçek zamanlı uygulama için uygun değil.

Meta’daki araştırmacılar, difüzyon modeli tabanlı yaklaşıma kıyasla daha verimli bir model olan CM3Leon’u geliştirmek için token tabanlı dönüştürücü modellerini başarıyla kullandı.

CM3Leon’un Avantajları

Meta araştırmacıları blog yazısında, “CM3leon, önceki dönüştürücü tabanlı yöntemlere göre beş kat daha az işlemle eğitilmesine rağmen, metinden görüntüye üretim için son teknoloji ürünü bir performans elde ediyor” diye yazdı.

CM3Leon modelinin Meta tarafından kamu kullanımı için piyasaya sürülmesi veya Meta’nın ürünlerine entegre edilmesi belirsizliğini koruyor.

İlgili Haberler ve İçerikler

Wall Street Memes (WSM) - En Yeni Meme Coin

Puanımız

wall street memes
  • 1 Milyon Takipçili Topluluk
  • Deneyimli NFT Proje Sahipleri
  • Ön Satış Başladı - wallstmemes.com
  • Çıktığı Gün $300,000 Toplandı
wall street memes
Kripto varlıklar son derece değişken, düzensiz ve kontrolsüz bir yatırım ürünüdür.