Компания OpenAI представила ИИ, который может воспроизводить голос

Компания OpenAI представила Voice Engine — новый инструмент на основе искусственного интеллекта, который способен эмоционально, акцентно и достаточно реалистично озвучивать тексты голосом любого человека, имея 15-секундный образец звучания речи.

Об этом сообщили на сайте компании.

Отмечается, что Voice Engine разрабатывали около двух лет. Однако пока его нельзя скачать всем, ведь разработчики считают, что существует риск использования технологии недобропорядочно, в частности для создания дипфейков.

«Мы надеемся начать диалог об ответственном применении синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям. На основе этих обсуждений и результатов тестов мы примем обоснованное решение о том, стоит ли и как разворачивать эту технологию в масштабе», — отметили в компании.

ИИ-модель, с которой работает Voice Engine, также лежит в основе функции «Чтение вслух» чат-бота ChatGPT от компании OpenAI.

Компания видит несколько путей применения технологии:

В компании отмечают, что новый инструмент может помочь в восстановлении голоса пациентам с внезапными или дегенеративными состояниями речевого аппарата.

Кроме того, Voice Engine может позволить немым людям общаться, озвучивая естественным языком их текстовые запросы.

Источник: Afn.kz