The New York Times bloqueia uso de conteúdo pela OpenAI

O jornal bloqueou o “rastreador da Web” da OpenAI, o que barra a empresa de usar o conteúdo do jornal para treinar modelos de IA.

O The New York Times (NYT), um dos principais veículos de comunicação dos EUA, bloqueou o “rastreador da Web” da OpenAI. Isso significa que a empresa dona do ChatGPT não pode usar o conteúdo do jornal para treinar seus modelos de inteligência artificial (IA).

Para quem tem pressa:

  • O The New York Times (NYT), um dos principais veículos de comunicação dos EUA, bloqueou o “rastreador da Web” da OpenAI;
  • Na página “robots.txt” do NYT, consta que o jornal não permite o GPTBot, o rastreador que a OpenAI anunciou no começo do mês;
  • Isso significa que a empresa dona do ChatGPT não pode usar o conteúdo do jornal para treinar seus modelos de inteligência artificial (IA).

A mudança ocorre após o NYT atualizar seus termos de serviço, no começo de agosto, para proibir o uso de seu conteúdo para treinar modelos de IA. Na página “robots.txt” do NYT, consta que o jornal não permite o GPTBot, o rastreador que a OpenAI anunciou no começo do mês.

O NYT também está considerando entrar com uma ação legal contra a OpenAI por violações de direitos de propriedade intelectual.

OpenAI vs The New York Times

O jornal estadunidense atualizou seus termos de serviço em 3 de agosto. Nesta atualização, o veículo proibiu a extração do conteúdo produzido pela sua equipe para treinamento de aprendizado de máquina ou sistema de IA.

Além de textos, entram no conteúdo proibido pelo veículo: fotografias, imagens, ilustrações, designs, áudio, vídeos etc.

Sobre a ação legal contra a OpenAI, o caso é o seguinte:

  • Nas últimas semanas, a empresa e o NYT estiveram envolvidos em tensas negociações para tentar chegar a um acordo de licenciamento;
  • A OpenAI quer pagar o jornal para usar sua extensa biblioteca de conteúdo em ferramentas alimentadas por inteligência artificial;
  • As discussões se tornaram tão controversas que o jornal considera mover uma ação legal;
  • Um processo de um gigante como o NYT pode se tornar a maior disputa legal do momento em defesa dos direitos autorais em meio ao boom da IA ​​generativa.

Se processasse, o Times se juntaria a outros como Sarah Silverman e dois outros autores que processaram a empresa, em julho, pelo uso do Books3 – um conjunto de dados usado para treinar o ChatGPT que pode ter milhares de trabalhos protegidos por direitos autorais.

Além deles, Matthew Butterick, programador e advogado, alega que as práticas de coleta de dados da empresa equivalem a pirataria de software.

Fonte: Olhar Digital