xAI, Grok'un görüntü işleyebilen yeni model yapay zekasını tanıttı! xAI, Grok'un görüntü işleyebilen yeni model yapay zekasını tanıttı!

OpenAI, bu teknolojiyi "doğal ve gerçekçi" sesler üretmek için kullandığını belirtiyor. Bu, insan sesine oldukça yakın olan ve duygusal tonları bile yansıtabilen bir yapay ses üretme yeteneği anlamına geliyor.

Bu teknoloji, OpenAI'nın önceden mevcut olan metin-okuma API'sini temel alıyor. Şirket, bu teknolojiyi 2022'den beri geliştiriyor ve şu anda mevcut olan metin-okuma API'sinde bulunan hazır sesleri ve Sesli Okuma özelliğini güçlendirmek için kullanıyor.

OpenAI, Ses Motoru'nun kullanım alanlarının okuma yardımı, dil çevirisi ve konuşma bozukluğu olan kişilere yardım etmek gibi faydalı amaçlar için olduğunu belirtiyor. Örneğin, bir hasta için özel olarak oluşturulan bir Ses Motoru klonunun konuşma terapisinde kullanıldığı örnekleri bulunuyor.

Ancak, bu teknolojinin kötüye kullanılma potansiyeli de var. Kötü niyetli kişiler, bu teknolojiyi sahte ses kayıtları oluşturmak ve derin sahte videolar yapmak gibi amaçlar için kullanabilirler. Bu nedenle, OpenAI bu teknolojiyi tamamen piyasaya sürmeden önce gizlilik ve güvenlik konularını dikkate almak zorunda.

OpenAI, bu teknolojiyi kullanacak kişilerin izleyicilere seslerin yapay zeka tarafından üretildiğini açıklamalarını gerektirecek kurallar koydu. Ayrıca, teknolojiyi kötüye kullanmayı önlemek için seslerin kaynağını izleyen güvenlik önlemleri de alındı.

Şu anda, OpenAI'nin bu teknolojiyi tam olarak piyasaya sürme zamanı hakkında net bir bilgi yok. Ancak, potansiyel fiyatlandırma verilerine göre, bu teknolojinin ses klonlama hizmeti oldukça uygun bir fiyatla sunulacak gibi görünüyor.

Editör: Enes Sapmaz