Am petrecut mult timp analizând tiparele de citare AI. Iată ce arată cercetarea:
Ponderi factori de citare (aproximativ):
| Factor | Pondere | Ce înseamnă |
|---|
| Autoritate domeniu | 25-30% | Semnale de încredere, profil backlink, prezență în knowledge graph |
| Actualitate conținut | 20-25% | Dată publicare, frecvență update, date noi |
| Relevanță semantică | 20-25% | Cât de direct răspunde conținutul la query |
| Structură informație | 15-20% | Headere, liste, tabele, schema markup |
| Densitate factuală | 10-15% | Date concrete, statistici, citate de experți |
Procesul RAG, pe scurt:
- Query-ul utilizatorului e convertit într-un vector (reprezentare numerică)
- Sistemul caută segmente de conținut semantic similare
- Fiecare sursă e punctată pe baza mai multor factori
- Sursele cu scoruri de top apar ca citări în răspuns
Observație critică: Spre deosebire de căutarea tradițională unde concurezi pentru 10 poziții, la AI citările sunt mai degrabă binare – fie ești citat, fie nu. Totuși, pot fi citate mai multe surse, deci nu e un joc cu sumă zero.
Paradoxul autorității:
Cercetările arată că Reddit (40,1%) și Wikipedia (26,3%) domină citările LLM. Nu pentru că au cel mai „bun” conținut, ci pentru că sistemele AI au încredere în surse consacrate și validate de comunitate.