Магазин

Опен АИ може да клонира људски глас на основу 15 секунди снимка реалног гласа

1. апр 2024 15:19

| Обновљено: 1. апр 2024 14:47

Калифорнијска компанија Опен АИ представила је нови алат Војс енџин (Voice Engine) који може да клонира било који људски глас ако има на располагању само 15 секунди реалног гласа те особе.

Опен АИ може да клонира људски глас на основу 15 секунди снимка реалног гласа

Према тврдњи компаније, Војс енџин је први пут развијен 2022. године и његова почетна верзија је коришћена за претварање текста у говор за потребе АИ модела Чет Џи-Пи-Ти (Chat GPT).

На веб страници компаније Опен АИ је објављено неколико аудио примера правог људског гласа и његових синтетичких копија које је генерисала вештачка интелигенција. Такође, саопштено је да ова моћна технологија за сада неће бити јавно доступна због могућих опасности и злоупотреба.

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024

"Војс енџин представља наставак наших напора да разумемо границе технолошког развоја и поделимо са јавношћу могућности вештачке интелигенције", наводи се у саопштењу Опен АИ.

Компанија је рекла да се радује разговорима о изазовима и могућностима нове технологије клонирања гласова.

"Важно је да људи широм света схвате куда ова технологија води, без обзира да ли је ми сами широко примењујемо или не", закључује Опен АИ.