A presença cada vez maior de textos produzidos por modelos de linguagem vem ampliando a desconfiança dos leitores sobre o que, de fato, foi escrito por pessoas. Nesse cenário, a Wikipédia decidiu agir. Desde 2023, a comunidade da plataforma trabalha em um método próprio para reconhecer conteúdos gerados por inteligência artificial. O resultado desse esforço é um guia público que já vem sendo apontado por especialistas como o material mais completo disponível hoje para ajudar a identificar esse tipo de escrita.
### Projeto quer frear a enxurrada de textos gerados por IA
Esse trabalho faz parte do Project AI Cleanup, uma iniciativa criada por editores da Wikipédia para lidar com o enorme volume de alterações recebidas diariamente — muitas delas produzidas com auxílio de ferramentas de IA. Seguindo o estilo colaborativo característico do site, o grupo organizou um documento extenso, repleto de exemplos e análises, que aponta sinais concretos capazes de diferenciar textos escritos por humanos de conteúdos automatizados.
O guia também reforça uma percepção que já vinha ganhando força: ferramentas automáticas de detecção de IA ainda são, na prática, pouco confiáveis. Em vez de depender desses detectores, os editores optaram por focar em padrões de linguagem amplamente disseminados na internet e, consequentemente, muito presentes no treinamento dos modelos generativos.
### Os principais indícios observados pelos editores da Wikipédia
Entre os traços mais frequentes encontrados em textos gerados por IA, o guia destaca:
- **Introduções genéricas e grandiosas**, com frases sobre a “importância” de um tema, muitas vezes usando expressões como “um momento crucial” para inflar o assunto;
- **Exagero em menções à mídia**, ampliando o peso de aparições ou citações para fazer algo parecer mais relevante do que realmente é;
- **Uso recorrente de estruturas no gerúndio**, em construções como “refletindo a relevância contínua”, que tentam atribuir um ar de importância sem acrescentar informação concreta;
- **Linguagem vaga, com tom publicitário**, semelhante ao estilo de propagandas e posts promocionais, em vez de uma escrita direta, precisa e objetiva.
Segundo a análise da Wikipédia, esse conjunto de características aparece de forma consistente em textos criados por modelos de linguagem e tende a se repetir, mesmo com o avanço da tecnologia. Até é possível tentar disfarçar esses padrões, mas eliminá-los completamente é considerado difícil, já que eles estão profundamente enraizados nos dados usados para treinar as IAs.
### Público mais atento, impacto maior
O documento também aponta que, à medida que as pessoas passam a reconhecer melhor esses sinais, o efeito pode ser significativo. A mudança deve influenciar tanto a forma como o público consome informação quanto as estratégias adotadas para enfrentar a proliferação de conteúdo automatizado.
Em outras palavras, a Wikipédia aposta que entender como a IA escreve é um passo essencial para preservar a qualidade e a confiabilidade dos textos em um ambiente cada vez mais inundado por produções geradas por máquinas.