New York Times proíbe uso de seus conteúdos para treinar sistemas de IA

Créditos: CC/WikiCommons/Flickr/JavierDo

Com a atualização dos termos de serviço feita no último dia 03 de agosto, o New York Times proibiu o uso de seu contéudo para o desenvolvimento de softwares em geral, incluindo os destinados a treinar sistemas de machine learning e inteligência artificial. Por conteúdo entenda-se textos, fotos, ilustrações, designs, e arquivos de áudio e de vídeo, entre outros.

Segundo a direção do jornal, a proibição já constava em seus termos de serviço e a atualização das diretrizes foi a solução encontrada para eliminar toda e qualquer dúvida em relação a isso, e reforçar que violações implicam em penalidades civis ou criminais.

Caiu na rede…
Para melhorar sua precisão, os modelos de IA recebem o input de grandes volumes de dados. O problema é que essa coleta indiscriminada captura também conteúdos protegidos por direitos autorais que podem ser extraídos da internet sem autorização de seus proprietários.

Muito provavelmente, a medida do NYT visa fazer frente a uma alteração recente das políticas de privacidade do Google, que afirmou coletar dados públicos da rede para treinar seus serviços de IA como Bard e Cloud AI. A Open AI, dona do ChatGPT, reza pela mesma cartilha.

Ao se proteger desse “saque”, é bem provável que o NYT faça escola. A News Corp, proprietária do The Wall Street Journal tem planos de taxar seu conteúdo para desenvolvedores de IA.