Passei bastante tempo analisando padrões de citação de IA. Eis o que as pesquisas mostram:
Pesos dos fatores de citação (aproximados):
| Fator | Peso | O que significa |
|---|
| Autoridade do domínio | 25-30% | Sinais de confiança, perfil de backlinks, presença em knowledge graph |
| Atualidade do conteúdo | 20-25% | Data de publicação, frequência de atualização, dados recentes |
| Relevância semântica | 20-25% | Quão diretamente o conteúdo responde à consulta |
| Estrutura da informação | 15-20% | Títulos, listas, tabelas, marcação de esquema |
| Densidade factual | 10-15% | Pontos de dados específicos, estatísticas, citações de especialistas |
O processo RAG explicado de forma simples:
- A consulta do usuário é convertida em um vetor (representação numérica)
- O sistema procura por trechos de conteúdo semanticamente similares
- Vários fatores pontuam cada fonte potencial
- As fontes com maior pontuação são citadas na resposta
Insight crítico: Ao contrário da busca tradicional, onde você compete por 10 posições, as citações em IA são mais binárias - ou você é citado ou não. Mas várias fontes podem ser citadas, então não é soma zero.
O paradoxo da autoridade:
Pesquisas mostram que Reddit (40,1%) e Wikipedia (26,3%) dominam as citações de LLM. Isso não é porque têm o “melhor” conteúdo - é porque os sistemas de IA confiam em fontes consolidadas e validadas pela comunidade.