Relatórios confirmam que Meta e Microsoft usaram a Books3; no caso da Anthropic, a prática está documentada em processo judicial. A Justiça americana já reconheceu “uso justo” em decisão preliminar favorável à Meta, mas o caso segue em curso. Os autores argumentam que as big techs competem com seus próprios livros e desvalorizam o mercado. Emails internos mostram que a Meta estuda pagar licenciamento. O caso da Anthropic é o mais grave, com risco de indenizações de até US$ 1 trilhão, pois além da Books3 usou também Library Genesis (5 milhões de livros) e PiLiMi (2 milhões). O juiz determinou julgamento em dezembro para calcular reparações. Benjamin Mann, cofundador da Anthropic, admitiu ter baixado livros piratas desde 2019, quando ainda estava na OpenAI. Na última semana, a Anthropic anunciou acordo com autores, ainda não detalhado, que aguarda validação judicial. Enquanto isso, o setor de IA observa com apreensão, já que outras empresas também usaram pirataria em seus treinamentos. Emails da Meta revelam que a empresa recorreu à Library Genesis e escondeu evidências. O temor é que todas as gigantes precisem pagar altos valores para compensar autores de livros, artigos e músicas.
domingo, 31 de agosto de 2025
PIRATARIA NA INTELIGÊNCIA ARTIFICIAL
Pelo menos três empresas de inteligência artificial dos EUA usaram livros de Clarice Lispector, Chico Buarque, Paulo Coelho e outros autores brasileiros para treinar seus modelos sem autorização, sem pagar e a partir de cópias piratas da internet. As companhias envolvidas são a Meta (LLaMa), Anthropic (Claude) e Microsoft (Megatron-Turing), que utilizaram a base pirata Books3, com quase 200 mil títulos. As empresas defendem que se trata de “uso justo” e alegam que os modelos não reproduzem as obras, mas produzem conteúdo transformado. A Folha analisou a Books3 e encontrou 109 obras de 31 autores brasileiros, como Jorge Amado, Rubem Fonseca, Raduan Nassar, Bernardo Carvalho e Daniel Galera. Paulo Coelho é o mais pirateado (31 livros), seguido por Clarice, com traduções em inglês, sueco e italiano. Há também Jorge Amado, Paulo Freire, Rubem Fonseca, João Cabral de Melo Neto, além de Machado de Assis e Euclides da Cunha, únicos em domínio público. No total, apenas 21 livros nacionais aparecem em português. A base valoriza textos pela qualidade: “O Alienista” recebeu nota 8, “A Hora da Estrela”, 9.
Nenhum comentário:
Postar um comentário