Компанія OpenAI представила інструмент на основі штучного інтелекту Voice Engine, який може озвучувати текст голосом іншої людини.

Маючи 15-секундний зразок звучання мови, інструмент може відтворити голос будь-якої людини. Voice Engine має таку ж модель ШІ, що лежить в основі функції «читання вголос» чат-боту ChatGPT. 

Інструмент пропонують використовувати для перекладу відео та подкастів. Voice Engine зберігає природний акцент мовця навіть у перекладі. Також розробники зазначають, що Voice Engine може допомогти людям, які не можуть читати, або дітям у навчанні, оскільки природне звучання краще сприймається, ніж роботизовані голоси.

Voice Engine можна застосовувати для відновленні голосу пацієнтам, які мають порушення мовленнєвого апарату. Люди зможуть спілкуватися, озвучуючи природньою мовою свої текстові запити завдяки інструменту, додають у OpenAI.

OpenAI створила Voice Engine наприкінці 2022 року, але наразі публічного доступу до нього немає. Розробники побоюються, що його можуть використовувати для створення діпфейків.

 

У лютому лабораторія досліджень штучного інтелекту OpenAI запустила штучний інтелект Sora, що вміє перетворювати текст і нерухоме зображення у відео або розширювати відео, яке вже існує, і заповнювати відсутні кадри в ньому.