Relatórios confirmam que Meta e Microsoft usaram a Books3; no caso da Anthropic, a prática está documentada em processo judicial. A Justiça americana já reconheceu “uso justo” em decisão preliminar favorável à Meta, mas o caso segue em curso. Os autores argumentam que as big techs competem com seus próprios livros e desvalorizam o mercado. Emails internos mostram que a Meta estuda pagar licenciamento. O caso da Anthropic é o mais grave, com risco de indenizações de até US$ 1 trilhão, pois além da Books3 usou também Library Genesis (5 milhões de livros) e PiLiMi (2 milhões). O juiz determinou julgamento em dezembro para calcular reparações. Benjamin Mann, cofundador da Anthropic, admitiu ter baixado livros piratas desde 2019, quando ainda estava na OpenAI. Na última semana, a Anthropic anunciou acordo com autores, ainda não detalhado, que aguarda validação judicial. Enquanto isso, o setor de IA observa com apreensão, já que outras empresas também usaram pirataria em seus treinamentos. Emails da Meta revelam que a empresa recorreu à Library Genesis e escondeu evidências. O temor é que todas as gigantes precisem pagar altos valores para compensar autores de livros, artigos e músicas.
Pesquisar este blog
domingo, 31 de agosto de 2025
PIRATARIA NA INTELIGÊNCIA ARTIFICIAL
Pelo menos três empresas de inteligência artificial dos EUA usaram livros de Clarice Lispector, Chico Buarque, Paulo Coelho e outros autores brasileiros para treinar seus modelos sem autorização, sem pagar e a partir de cópias piratas da internet. As companhias envolvidas são a Meta (LLaMa), Anthropic (Claude) e Microsoft (Megatron-Turing), que utilizaram a base pirata Books3, com quase 200 mil títulos. As empresas defendem que se trata de “uso justo” e alegam que os modelos não reproduzem as obras, mas produzem conteúdo transformado. A Folha analisou a Books3 e encontrou 109 obras de 31 autores brasileiros, como Jorge Amado, Rubem Fonseca, Raduan Nassar, Bernardo Carvalho e Daniel Galera. Paulo Coelho é o mais pirateado (31 livros), seguido por Clarice, com traduções em inglês, sueco e italiano. Há também Jorge Amado, Paulo Freire, Rubem Fonseca, João Cabral de Melo Neto, além de Machado de Assis e Euclides da Cunha, únicos em domínio público. No total, apenas 21 livros nacionais aparecem em português. A base valoriza textos pela qualidade: “O Alienista” recebeu nota 8, “A Hora da Estrela”, 9.
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário