Dicionário processa OpenAI por uso de conteúdos protegidos no treino do ChatGPT

A Merriam-Webster, em conjunto com a Encyclopedia Britannica, abriu uma ação contra a OpenAI, alegando uso não autorizado de conteúdo protegido por direitos de autor para treinar o ChatGPT.
Segundo a queixa, a OpenAI copiou mais de cem mil artigos, verbetes de enciclopédias e entradas de dicionários de fontes online para treinar o modelo.
A ação sustenta três violações: cópia em larga escala, uso do conteúdo para treinar a IA e geração de respostas que se assemelham ao conteúdo original.
Os queixosos afirmam que o ChatGPT reproduz de forma textual ou quase textual informações do dicionário, desviando tráfego dos seus sites e gerando “alucinações” quando não há dados suficientes.
Pedem indemnização e uma ordem judicial para impedir as práticas alegadas; a OpenAI não respondeu de imediato ao pedido de comentário.

O Merriam-Webster abriu um processo contra a OpenAI, alegando uso não autorizado de conteúdos protegidos por direitos de autor para treinar o ChatGPT. A ação envolve também a Encyclopedia Britannica, empresa-mãe das duas entidades, que together integram a queixa.

Segundo o processo, a OpenAI terá copiado mais de 100 mil artigos, verbetes de enciclopédias e entradas de dicionários de fontes online. A queixa afirma que esse material foi utilizado para ensinar o ChatGPT a responder a pedidos de utilizadores sem autorização.

Os queixosos sustentam que a prática viola direitos de autor de três formas: cópia em larga escala, treino de IA com esse conteúdo e geração de respostas que reproduzem ou se assemelham ao conteúdo original. As respostas do chat podem afastar utilizadores de fontes originais.

A ação afirma ainda que o conteúdo de dicionário tem sido usado em alucinações de IA, ou seja, respostas inventadas pela IA quando faltam dados. Também sustenta que o ChatGPT omite partes do conteúdo, tornando explicações incompletas.

Os demandantes pedem indemnização e uma ordem judicial para impedir a continuidade das alegadas práticas. Em reação, a Euronews Next contactou a OpenAI, mas não obteve resposta imediata.

Reação e contexto regulatório

Especialistas destacam que a disputa pode influenciar acordos de licenciamento e a forma como modelos de IA utilizam conteúdos protegidos. O caso pode abrir caminhos para futuras ações envolvendo grandes bases de dados usados para treinar IA.