OpenAI afirma clonar a voz de qualquer pessoa com apenas 15 segundos

OpenAI afirma clonar a voz de qualquer pessoa com apenas 15 segundos

A OpenAI revelou que, recentemente, realizou um teste em pequena escala da nova tecnologia “Voice Engine”, que segundo a empresa, permite clonar qualquer voz com apenas 15 segundos de áudio.

A empresa afirma que, com esta nova tecnologia, é possível clonar a voz de qualquer pessoa, com uma fonte de apenas 15 segundos, criando uma voz natural e que pode ser ajustada para diferentes emoções e de forma realista.

A tecnologia é baseada na existente API “texto to speech” que se encontra em desenvolvimento desde 2022. Algumas das funcionalidades desta API já começaram a ser usadas nos sistemas da empresa, como é o caso do leitor do ChatGPT, mas agora a empresa pretende ir mais longe.

A ideia será criar um sistema que seja capaz de ajudar os utilizadores na leitura de conteúdos, e que possa recriar a voz de qualquer pessoa para rapidamente a integrar nos diferentes sistemas.

Embora a ideia da OpenAI seja certamente para usos benéficos da tecnolgoiia, ao mesmo tempo existem também preocupações na forma como esta tecnologia pode facilitar a criação de conteúdos deepfake, recriando a voz de personalidades de interesse para o caso. Com isto em mente, a OpenAI admite que existem ainda pontos a resolver com o Voice Engine, e que este não se encontra disponível para uso em público.

A OpenAI afirma ainda que existem sérios riscos no uso destas tecnologias, ainda mais em ano de eleições, o que agrava a situação dos deepfakes – que atualmente já se encontram a usar bastante a IA para tal.

Os testes que estão a ser realizados pela empresa serão apenas limitados e de forma bastante controlada, sendo que qualquer uso indevido da tecnologia resulta no imediato bloqueio no acesso à mesma.

Além disso, todos os que usarem o Voice Engine durante o período de teste devem obrigatoriamente indicar que as mensagens de voz foram criadas usando IA, e existem mecanismos de marca de água para identificar quando o conteúdo é criado pela ferramenta da OpenAI.

De momento ainda se desconhece quando a tecnologia da OpenAI ficará publicamente disponível, com a empresa também a não revelar detalhes neste sentido.