As ferramentas de clonagem de voz baseadas em IA, que antes eram exclusividade de grandes estúdios de áudio e empresas de produção de mídia, agora estão se tornando cada vez mais acessíveis ao público em geral.
Com o avanço da tecnologia, essas ferramentas estão ficando mais baratas e fáceis de usar, permitindo que qualquer pessoa crie uma voz sintética semelhante à sua própria ou a de outra pessoa.
No entanto, essa tecnologia também levanta preocupações éticas e de segurança, já que pode ser usada para criar conteúdo falso e enganoso.
A clonagem de voz é uma aplicação da Inteligência Artificial que tem evoluído rapidamente nos últimos anos. Recentemente, um especialista em IA testou um software de clonagem de voz em sua própria voz.
Ele criou um arquivo de áudio com 12 parágrafos, sendo que sete deles eram sua voz real e os outros cinco foram gerados pelo software.
Ele pediu para membros de sua família ouvirem e identificarem qual era a voz real e qual era a gerada pela IA. O resultado foi surpreendente: algumas pessoas tiveram sucesso em identificar a voz real e outras não.
Os resultados foram diferentes entre pessoas que conheciam bem a voz do autor e pessoas que não conheciam tão bem. O experimento mostra que a clonagem de voz está se tornando cada vez mais avançada.
Há três anos, o Massachusetts Institute of Technology (MIT) trabalhou com uma empresa chamada Respeecher para gerar um vídeo falso de Richard Nixon anunciando o fracasso do pouso da Apollo 11 na Lua.
O processo necessário para clonar a voz de Nixon foi bastante trabalhoso. Os pesquisadores coletaram centenas de clipes curtos da voz de Nixon e, em seguida, fizeram com que um dublador gravasse a si mesmo falando as mesmas palavras.
O ator então leu o discurso alternativo de pouso na lua de Nixon e o software modificou suas palavras para soar como as de Nixon. Esse processo parece render excelentes resultados, mas tem um custo alto.
Recentemente, o especialista em IA experimentou uma startup pouco conhecida chamada Play.ht. Tudo o que ele precisou fazer foi enviar um vídeo de 30 minutos lendo um texto de sua escolha e esperar algumas horas.
O Play.ht é um serviço de conversão de texto em fala, então não precisou contratar um dublador. Uma vez treinado em sua voz, o software pôde gerar fala humana realista a partir de texto escrito em apenas alguns minutos.
O melhor de tudo é que não precisou pagar um centavo. Ele conseguiu clonar sua voz usando o plano gratuito do Play.ht.
Sistemas realistas de conversão de texto em fala são difíceis de construir porque os seres humanos pronunciam a mesma palavra de maneiras diferentes, dependendo do contexto.
Fazemos isso dependendo do que vem antes ou depois de uma palavra em uma frase, e seguimos regras complexas e amplamente compartilhadas sobre entonação, ênfase e ritmo.
Por essa razão, a clonagem de voz usando IA é um processo complexo e caro. No entanto, a evolução da tecnologia de IA está tornando essa tarefa cada vez mais fácil e barata.
A clonagem de voz tem várias aplicações, como dublagem de filmes, assistentes virtuais, serviços de atendimento ao cliente e muito mais.
Com o desenvolvimento de sistemas de clonagem de voz cada vez mais realistas, podemos esperar que essa tecnologia seja cada vez mais usada no futuro.
No entanto, esta tecnologia também pode ser usada de maneira indevida, como para criar notícias falsas ou praticar golpes se passando por outra pessoa.
Atualmente, não existe uma política de uso específica para ferramentas de clonagem de voz em nenhum país, o que pode gerar potenciais impactos negativos.
No entanto, em alguns países, há leis que abrangem questões relacionadas à privacidade e direitos autorais, que podem ser aplicadas em casos envolvendo o uso indevido de clonagem de voz.
Além disso, algumas empresas que desenvolvem essas ferramentas podem ter suas próprias políticas de uso e restrições para evitar o uso indevido.
Em geral, é importante que as ferramentas de clonagem de voz sejam usadas de forma ética e responsável, considerando os potenciais impactos negativos que podem ter em indivíduos e comunidades.
Via: Slate