Voltar para o blog
Notícias de IA

Como novas regras podem frear a prática de scraping de IA e proteger o conteúdo na internet

25 de março de 2026
19:30
Ética em IAinteligência artificialtecnologiaDireitos Autoraisinovação digitalscrapingCreative CommonsCC Signalsinternet abertaproteção de conteúdo
Como novas regras podem frear a prática de scraping de IA e proteger o conteúdo na internet

A crescente utilização de inteligência artificial (IA) tem provocado uma série de desafios para a internet aberta, especialmente no que diz respeito à prática do scraping — a extração automática de conteúdo de sites para alimentar modelos de IA. Essa atividade, muitas vezes feita sem autorização, ameaça a sustentabilidade de criadores de conteúdo e a qualidade da informação disponível online.

O dilema do scraping na era da IA

Historicamente, o scraping foi uma prática tolerada, mesmo que tecnicamente ilegal em alguns casos, pois ajudava a viabilizar serviços essenciais como mecanismos de busca. Sites permitiam essa coleta de dados, alinhados à visão de uma web aberta, baseada em princípios de respeito, reconhecimento e reciprocidade.

Imagem relacionada ao artigo de The Conversation AI
Imagem de apoio da materia original.

No entanto, com o avanço dos sistemas de IA generativa, que dependem de grandes volumes de dados para treinamento, essa dinâmica mudou. Empresas de IA passaram a usar bots para coletar massivamente conteúdos de plataformas diversas — desde redes sociais como Reddit até repositórios acadêmicos e veículos jornalísticos — muitas vezes sem compensação ou reconhecimento aos criadores originais.

Consequências práticas para a internet e seus criadores

Diante da pressão, muitos veículos de notícias começaram a bloquear rastreadores automáticos, enquanto criadores optam por reduzir sua presença online ou abandonar certas plataformas. Essa reação cria barreiras ao acesso aberto à informação, prejudicando a democracia, a inovação científica e as comunidades criativas.

Além disso, as exceções previstas em legislações de direitos autorais, como o uso justo para pesquisa, não foram atualizadas para contemplar o uso massivo de dados por IA, gerando incertezas jurídicas e dificultando a gestão legal do conteúdo no ambiente digital.

CC Signals: um novo caminho para o respeito entre máquinas e criadores

Em resposta a esse cenário, a organização sem fins lucrativos Creative Commons propôs o CC Signals, uma estrutura voluntária que permite aos criadores especificar, por meio de instruções legíveis por máquinas, como seu conteúdo pode ser utilizado por sistemas automatizados.

Essa iniciativa busca equilibrar o uso responsável da IA com a promoção da inovação, fundamentando-se nos princípios de consentimento, compensação e reconhecimento. Funciona de forma semelhante ao robots.txt, arquivo que define quais partes de um site podem ser acessadas por bots, mas com maior nuance para diferentes tipos de uso.

Vantagens do CC Signals

  • Oferece controle mais detalhado aos criadores sobre o uso de seu material por máquinas.
  • Contribui para a manutenção da qualidade dos dados usados no treinamento de IA, reduzindo vieses.
  • Beneficia criadores menores, que normalmente têm menos poder para negociar com grandes empresas de tecnologia.

Desafios na implementação

O principal desafio está na definição e aplicação prática de compensações financeiras ou em bens, que o sistema pode exigir. Estabelecer e distribuir taxas de licenciamento para milhões de obras acessadas por IA é uma tarefa complexa e ainda em desenvolvimento.

A Creative Commons planeja lançar guias de boas práticas para facilitar a adoção do CC Signals, mas o projeto ainda está em andamento.

Perspectivas para o futuro da internet e da IA

Embora o CC Signals não seja uma solução legal definitiva, representa uma tentativa importante de estabelecer “boas maneiras para máquinas”, promovendo respeito e reconhecimento aos criadores sem impedir avanços tecnológicos essenciais.

É fundamental que novas ideias e frameworks desse tipo sejam considerados para garantir um equilíbrio entre proteção dos direitos autorais e o desenvolvimento da inteligência artificial.

Links úteis