Teknoloji şirketleri yapay zeka alanında ilerlemek için acele ettiği şu günlerde Meta en yeni yapay zeka projesi olan CM3Leon adlı görsel oluşturma aracını duyurdu. Meta, bu modelin, kendi sınıfındaki diğer tüm modellerden daha iyi bir son teknoloji performansa sahip olduğunu bildirdi.
Meta, Telif Hakkı Endişelerini Gidermeyi Amaçlıyor
Yapay zeka programlarını eğitmek için kullanılan telif hakkıyla korunan materyaller, araçların işi hızlandırma ve içerik üretme kapasitelerinin yaygın olarak övülmesine rağmen, birçok tartışmaya konu oldu. Sonuç olarak, içerik oluşturucular tarafından çalışmalarının izinsiz kullanımı için tazminat talep eden bir dizi dava açıldı.
Örneğin, ABD’de komedyen ve yazar Sarah Silverman, Meta ile OpenAI firmalarını, kendisinin izni olmadan yapay zeka modellerini eğitmek için çalışmalarını uygunsuz bir şekilde kullandıkları iddiasıyla dava ediyor.
Bu nedenle, bu işletmelerin tasarımlarıyla telif haklarını ihlal etmeden yollarına devam etmeleri çok önemli. Meta, çalışmasında bunu kabul etti.
Introducing CM3leon, a first-of-its-kind multimodal model that achieves state-of-the-art performance for text-to-image generation with 5x the compute efficiency of competitive models.
More details ➡️ https://t.co/VR12zkmLDs pic.twitter.com/jUnG7G1Fxf
— AI at Meta (@AIatMeta) July 14, 2023
CM3Leon’un Özellikleri ve Çok Modlu Yetenekleri
Şirketin İngilizcede bukalemun (chameleon) olarak telaffuz edilen CM3Leon adlı yeni ürünü, telif hakkı endişelerini tamamen ortadan kaldırmak için lisanslı Shutterstock görselleri üzerinde eğitildi.
Model, metin ve resim arasında dönüşüm yapabildiği gibi tam tersini de gerçekleştirebiliyor ve bu da onu çok modlu hale getiriyor. Bu, Meta’ya göre, gelecekteki görüntü anlama modellerinin temelini oluşturan görüntüler için altyazı oluşturma yeteneğine sahip ilk üretken yapay zeka modellerinden biri olmasını sağlıyor.
Konu hakkında açıklama yapan Meta, “CM3Leon’un yetenekleri sayesinde görüntü oluşturma araçları, girdi komutlarını daha iyi takip eden daha tutarlı görüntüler üretebilir. CM3Leon’un çeşitli testlerdeki mükemmel performansını, daha doğru resim üretimi ve anlamaya yönelik bir adım olarak görüyoruz.” ifadelerini kullandı.
Difüzyon ve CM3Leon: Alternatif Bir Yaklaşım
Stable Diffusion, DALL-E ile Midjourney gibi üretken yapay zeka sanat araçlarının yaygınlaşmasıyla birlikte, yapay zeka tarafından üretilen grafikler kavramı iyice yerleşti ve artık yeni veya yenilikçi bir fikir olarak görülmüyor. Bununla birlikte, CM3leon’un geliştirilmesi için Meta tarafından kullanılan teknikler yeni. Bu da Meta’nın temel modelin yapabileceğini iddia ettiği “inanılmaz” performansa yol açıyor.
Kararlı Difüzyon, modern metinden görüntüye üretim sistemlerinde yaygın olarak kullanılan difüzyon modelleri için kullanılan bir terim. CM3leon alternatif bir yöntem olarak token tabanlı bir dönüştürücü modeli kullanıyor.
Meta’nın analizine göre, difüzyon sadece yavaşlığı nedeniyle değil, aynı zamanda yüksek işlem maliyeti nedeniyle çoğu gerçek zamanlı uygulama için uygun değil.
Meta’daki araştırmacılar, difüzyon modeli tabanlı yaklaşıma kıyasla daha verimli bir model olan CM3Leon’u geliştirmek için token tabanlı dönüştürücü modellerini başarıyla kullandı.
CM3Leon’un Avantajları
Meta araştırmacıları blog yazısında, “CM3leon, önceki dönüştürücü tabanlı yöntemlere göre beş kat daha az işlemle eğitilmesine rağmen, metinden görüntüye üretim için son teknoloji ürünü bir performans elde ediyor” diye yazdı.
CM3Leon modelinin Meta tarafından kamu kullanımı için piyasaya sürülmesi veya Meta’nın ürünlerine entegre edilmesi belirsizliğini koruyor.
İlgili Haberler ve İçerikler
- USTC Coin Yorum – 17 Temmuz 2023
- yPredict Nereden ve Nasıl Satın Alınır?
- Wall Street Memes Token Nereden ve Nasıl Satın Alınır?
Wall Street Memes (WSM) - En Yeni Meme Coin
- 1 Milyon Takipçili Topluluk
- Deneyimli NFT Proje Sahipleri
- Ön Satış Başladı - wallstmemes.com
- Çıktığı Gün $300,000 Toplandı