YouTube alerta OpenAI sobre recolha de dados para treino do Sora

YouTube alerta OpenAI sobre recolha de dados para treino do Sora

Os modelos de IA no mercado necessitam de material usado para o treino dos mesmos. Isso é, muitas vezes, feito com conteúdos que se encontram disponíveis pela internet em geral – e o YouTube engloba-se certamente numa das plataformas de interesse para criadores de modelos de IA recolherem dados.

No entanto, nem todas as entidades pretendem que os seus dados sejam recolhidos e usados para estes modelos, e já ocorreram casos onde as mesmas processaram nomes como a OpenAI pela recolha e uso dos mesmos.

Em março, durante uma entrevista, a CTO da OpenAI, Mira Murati, deixou a incerteza sobre a forma como os modelos da empresa recolhem os seus dados, nomeadamente para usar no novo serviço Sora, que permite criar vídeos usando apenas IA. O YouTube é uma das plataformas que foi visadas, mas que, na altura, a CTO não clarificou se era uma fonte de dados para a empresa.

Agora, o CEO do YouTube, Neal Mohan, veio deixar mais clarificações sobre essa ideia. Segundo o mesmo, numa recente entrevista com o Bloomberg Originals, a Google e o YouTube não criaram nenhum acordo com a OpenAI para a recolha de vídeos do YouTube para uso nos modelos da OpenAI no Sora.

youtube a ser usado

O CEO vai ainda mais longe, dizendo que, caso a OpenAI esteja a usar conteúdos do YouTube para treinar os seus modelos de IA, isso seria uma violação dos termos de serviço da empresa, o que poderia abrir a possibilidade de novos processos surgirem por parte da empresa.

O executivo afirma que, quando um criador do YouTube envia um vídeo para a plataforma, este espera que os seus conteúdos estejam dentro dos termos da mesma, e sejam usados em conformidade com estes. A recolha dos vídeos para usos em modelos de IA iria contar os termos do YouTube.

De momento ainda existe muita incerteza sobre a forma como a OpenAI encontra-se a treinar o Sora. Este conta com uma grande promessa para o mercado, mas a forma como a empresa usa os conteúdos recolhidos para treino do seu modelo é ainda uma incerteza e algo importante a ter em conta para o uso da plataforma.