Опен АИ може да клонира људски глас на основу 15 секунди снимка реалног гласа
Према тврдњи компаније, Војс енџин је први пут развијен 2022. године и његова почетна верзија је коришћена за претварање текста у говор за потребе АИ модела Чет Џи-Пи-Ти (Chat GPT).
На веб страници компаније Опен АИ је објављено неколико аудио примера правог људског гласа и његових синтетичких копија које је генерисала вештачка интелигенција. Такође, саопштено је да ова моћна технологија за сада неће бити јавно доступна због могућих опасности и злоупотреба.
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024
"Војс енџин представља наставак наших напора да разумемо границе технолошког развоја и поделимо са јавношћу могућности вештачке интелигенције", наводи се у саопштењу Опен АИ.
Компанија је рекла да се радује разговорима о изазовима и могућностима нове технологије клонирања гласова.
"Важно је да људи широм света схвате куда ова технологија води, без обзира да ли је ми сами широко примењујемо или не", закључује Опен АИ.