OpenAI’den Yeni Ses Klonlama Teknolojisi: Voice Engine

AA ChatGPT’yi kullanıma sunmasıyla dünya genelinde bir anda popüler olan OpenAI, inovasyon çalışmalarına hız kesmeden devam ediyor. Şirket, kullanıcılarına 15 saniyelik ses kayıtlarından konuşmacının sesini klonlayabilen yeni “Voice Engine” teknolojisini tanıttı.

Yüksek Benzerlik Derecesi

Şirketin açıklamasına göre, Voice Engine yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine oldukça benzeyen bir konuşma üretebiliyor. Bu teknolojinin 2022’de geliştirildiği belirtilirken, “kötüye kullanım potansiyeli” nedeniyle daha geniş bir kullanım için dikkatli bir yaklaşım benimsendiği vurgulandı.

OpenAI'den Yeni Ses Klonlama Teknolojisi: Voice Engine

Güvenlik Önlemleri

Güvenlik endişelerini önlemek adına, Voice Engine’in test aşamasındaki kullanıcı ortaklarına belirli kurallar getirildi. Kişi veya kuruluşların kimliğini taklit etmenin yasaklandığı, orijinal konuşmacının izni olmadan kullanılamayacağı ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça belirtilmesi gerektiği duyuruldu.

Çeviri Yeteneği

Açıklamada ayrıca, Voice Engine’in orijinal konuşmacının ses özelliğini koruyarak çeviri yapabildiği bilgisi de paylaşıldı. Video ve podcast içerik üreticilerinin, bu özellik sayesinde kendi sesleriyle dünya çapında izleyici kitlesine ulaşabileceği ve çevrilen seslerde orijinal konuşmacının aksanının da korunabileceği vurgulandı.