OpenAI pode pagar até cinco milhões de dólares para treinar IA com artigos de notícias

OpenAI pode pagar até cinco milhões de dólares para treinar IA com artigos de notícias

Os sistemas de IA funcionam com base em modelos, que necessitam de obter conhecimento de várias fontes. A OpenAI encontra-se a trabalhar para melhorar os seus modelos de IA, e está agora a voltar-se para alguns meios de imprensa como forma de obter tal.

De acordo com o portal The Information, a OpenAI encontra-se disposta a pagar quase cinco milhões de dólares para as entidades que permitam recolher dados dos seus conteúdos para treino dos modelos de IA do ChatGPT.

A ideia da empresa será usar esta informação para o treino e melhoria do modelo, usando os conteúdos históricos das noticias disponíveis nestas plataformas. No entanto, apesar disso, a empresa pode ter alguns problemas para encontrar interessados em aceitar o acordo.

Segundo a mesma fonte, a OpenAI já terá contactado alguns meios de imprensa com as propostas, que envolvem pagamentos atuais de até cinco milhões de dólares. No entanto, muitas entidades consideram este valor reduzido tendo em conta a informação que é acedida.

É também importante relembrar que nem todas as entidades encontram-se abertas a fornecer este género de conteúdos para treino de IA. Recentemente o The New York Times confirmou que iria processar a OpenAI e a Microsoft pela recolha não autorizada de conteúdos do seu portal, para uso no treino de modelos de IA.

O jornal considera que as empresas devem ser responsabilizadas em milhares de milhões de dólares pelos prejuízos causados. Em parte, o The New York Times afirma que as plataformas de IA encontram-se a recolher os conteúdos dos seus portais, e a disponibilizar os mesmos gratuitamente por intermédios como o ChatGPT e Copilot.

Ao mesmo tempo, surgem ainda rumores que empresas como a Apple também se encontram interessadas em obter os conteúdos de fontes de entidades noticiosas. Neste caso, a Apple estaria disposta a pagar quase 50 mil milhões de dólares para obter acesso a estes conteúdos, na ideia de treinar os seus próprios modelos de IA.