Um relatório recente da 404 Media revelou que a Runway AI, Inc., uma startup de inteligência artificial (IA) avaliada em US$ 1,5 bilhão, está usando vídeos pirateados do YouTube para treinar seu modelo de geração de vídeo, o Jupiter.
A empresa, que conta com investimentos de gigantes como Google e NVIDIA, teria montado um vasto banco de dados com vídeos extraídos de diversas fontes, incluindo plataformas de conteúdo pirateado.
De acordo com o relatório, a 404 Media obteve uma planilha detalhando os canais do YouTube que foram alvo dessa coleta, listando nomes de peso como Netflix, Disney, Sony, Pixar e Vice News.
Além disso, criadores de conteúdo famosos, como Marques Brownlee e Casey Neistat, também foram mencionados.
Uma fonte anônima, que supostamente trabalhou na Runway, afirmou que a planilha fazia parte de um esforço coordenado dentro da empresa para coletar conteúdo da internet.
Esse material era utilizado para alimentar um software de código aberto que pegava vídeos diretamente do YouTube e outros sites.
A planilha não só listava os canais, mas também incluía links específicos de vídeos, mostrando um método sistemático de coleta.
Segundo a fonte, os funcionários da Runway eram instruídos a buscar vídeos com base em palavras-chave e a segmentar o conteúdo por categorias, como animações e filmes de estudantes.
Sites de conteúdo pirata também podem ter sido usados
Essa prática não se limitava ao YouTube; sites de conteúdo pirateado também eram visados. A Runway não respondeu aos pedidos de comentário da 404 Media.
O Google, por sua vez, redirecionou a publicação para suas declarações anteriores, nas quais já havia afirmado que o uso de vídeos do YouTube para treinar modelos de IA, como o gerador de vídeo Sora da OpenAI, violava as regras da plataforma.
O modelo de IA da Runway, conhecido internamente como Gen-3, teria gerado conteúdo muito semelhante aos vídeos retirados do YouTube, segundo os testes da 404 Media.
Após o contato com a empresa, a geração desses vídeos foi interrompida. A Runway é uma das startups de IA mais influentes do mundo atualmente.
Em junho do ano passado, a empresa foi avaliada em US$ 1,5 bilhão após uma rodada de financiamento Série C e foi reconhecida como uma das 100 empresas mais influentes pela revista TIME, que listou mais de uma dúzia de empresas de IA.
O uso de conteúdo não autorizado para treinar modelos de IA mais uma vez levanta grandes questões éticas e legais. Desta vez, a coleta de dados por modelos de IA chegou a outro nível.