
AA ChatGPT’yi kullanıma sunmasıyla dünya genelinde bir anda popüler olan OpenAI, inovasyon çalışmalarına hız kesmeden devam ediyor. Şirket, kullanıcılarına 15 saniyelik ses kayıtlarından konuşmacının sesini klonlayabilen yeni “Voice Engine” teknolojisini tanıttı.
Yüksek Benzerlik Derecesi
Şirketin açıklamasına göre, Voice Engine yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine oldukça benzeyen bir konuşma üretebiliyor. Bu teknolojinin 2022’de geliştirildiği belirtilirken, “kötüye kullanım potansiyeli” nedeniyle daha geniş bir kullanım için dikkatli bir yaklaşım benimsendiği vurgulandı.
Güvenlik Önlemleri
Güvenlik endişelerini önlemek adına, Voice Engine’in test aşamasındaki kullanıcı ortaklarına belirli kurallar getirildi. Kişi veya kuruluşların kimliğini taklit etmenin yasaklandığı, orijinal konuşmacının izni olmadan kullanılamayacağı ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça belirtilmesi gerektiği duyuruldu.
Çeviri Yeteneği
Açıklamada ayrıca, Voice Engine’in orijinal konuşmacının ses özelliğini koruyarak çeviri yapabildiği bilgisi de paylaşıldı. Video ve podcast içerik üreticilerinin, bu özellik sayesinde kendi sesleriyle dünya çapında izleyici kitlesine ulaşabileceği ve çevrilen seslerde orijinal konuşmacının aksanının da korunabileceği vurgulandı.