Herhangi bir teknolojik ilerlemenin ortaya çıkışına tipik olarak önemli avantajların yanı sıra olumsuz istismar olasılığı da eşlik ediyor. Yapay zeka (AI) ise bu konuda bir istisna değil. Facebook’la Instagram’ın çatı şirketi olan Meta tarafından geliştirilen ve metinden konuşma üretebilen en son yapay zeka modeli, dolandırıcılık faaliyetlerini kolaylaştırma potansiyeline ilişkin endişeler nedeniyle piyasaya çıkışını ertelemek zorunda kaldı.
Meta kısa bir süre önce, metinsel girdiyi konuşma çıktısına dönüştürmek için eğitilmiş üretken bir yapay zeka modeli olan Voicebox’u tanıttı. Teknoloji devi, Voicebox’un “özel olarak eğitilmediği halde konuşma oluşturma görevlerini yerine getirebildiği ve en ileri düzeyde performans sergileyebildiğini” söyledi.
Modelin eğitim verileri, İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce olmak üzere altı farklı dilde kamuya açık sesli kitaplardan elde edilen 50 bin saatin üzerinde kayıtlı konuşma ve transkriptten oluşuyor. Bu sayede altı farklı dilde işitsel çıktı üretebiliyor ve bu diller arasında konuşma aktarımını kolaylaştırabiliyor.
“Aynı Dili Konuşmayanlar Anlaşabilecek”
Teknoloji şirketi yenilikten bahsederken, “Bu yetenek gelecekte, aynı dili konuşmasalar bile insanların doğal ve özgün bir şekilde iletişim kurmalarına yardımcı olmak için kullanılabilir.” dedi.
Meta’daki araştırmacılar, algoritmanın, her bir kişinin hangi dili konuştuğuna bakılmaksızın, kulağa daha çok konuşma gibi gelen bir konuşma yapabildiğini söylüyor. Bunun nedeni büyük ve çeşitli veri seti. Meta, “Sonuçlarımız, Voicebox tarafından üretilen sentetik konuşma üzerinde eğitilen konuşma tanıma modellerinin neredeyse gerçek konuşma üzerinde eğitilen modeller kadar iyi çalıştığını gösteriyor.” ifadelerini kullandı.
Voicebox kelime üretmekten daha fazlasını yapabiliyor. Ses dosyalarını da düzenleyebiliyor. Bu sayede kullanıcılar halihazırda önceden kaydedilmiş seslerdeki gürültüyü giderebiliyor. Ayrıca sesin bazı kısımlarını değiştirebiliyor ve boşlukları başka kelimelerle doldurabiliyorlar. Böylelikle tekrar kayıt yapmadan kaydın kişiye çok benzeyen bir sese sahip olmasını sağlayabiliyorlar.
Meta, Yapay Zekanın Diğer Yüzünü Gösteriyor
Meta, tüm bu yeteneklere sahip olmasına rağmen ne modelin ne de kaynak kodunun henüz kamuya sunulmayacağını belirtti.
Şirket, “Üretken konuşma modelleri pek çok ilginç şekilde kullanılabilir, ancak kötüye kullanılabilecekleri için şu anda Voicebox modelini veya kodunu halka açık hale getirmiyoruz.” dedi.
Şirket, teknolojinin geliştirilmesinde her ikisinin de önemini vurgulayarak, “Yapay zeka topluluğuna karşı açık olmanın ve yapay zeka alanındaki son gelişmeleri ilerletmek için araştırmalarımızı paylaşmanın önemli olduğunu düşünüyoruz. Ancak açıklık ve sorumluluk arasında doğru dengeyi bulmak da önemli” dedi.
Meta, bu bulgunun, bu durumda olduğu gibi, kasıtsız zarar vermek için kullanılabileceğini kabul etti.
Statista verileri, ABD’deki insanların en az yüzde 68’inin yapay zekanın “deep fake” yapmak için kullanılabileceğinden endişe ettiğini gösteriyor. Bunun nedeni, yapay zekanın son birkaç yılda uzun bir yol kat etmiş olması.