Jag har ägnat mycket tid åt att analysera AI-citeringsmönster. Här är vad forskningen visar:
Citeringsfaktorers viktningar (ungefärliga):
| Faktor | Vikt | Vad det betyder |
|---|
| Domänauktoritet | 25–30 % | Förtroendesignaler, backlink-profil, kunskapsgraf-närvaro |
| Innehållets aktualitet | 20–25 % | Publiceringsdatum, uppdateringsfrekvens, färska data |
| Semantisk relevans | 20–25 % | Hur direkt innehållet besvarar frågan |
| Informationsstruktur | 15–20 % | Rubriker, listor, tabeller, schema-markup |
| Faktadensitet | 10–15 % | Specifika datapunkter, statistik, expertcitat |
RAG-processen enkelt förklarad:
- Användarfrågan omvandlas till en vektor (numerisk representation)
- Systemet söker efter semantiskt liknande innehållsbitar
- Flera faktorer poängsätter varje potentiell källa
- Källor med högst poäng citeras i svaret
Viktig insikt: Till skillnad från traditionell sökning där du tävlar om 10 positioner är AI-citat mer binära – antingen citeras du eller inte. Men flera källor kan citeras, så det är inte nollsummespel.
Auktoritetsparadoxen:
Forskning visar att Reddit (40,1 %) och Wikipedia (26,3 %) dominerar LLM-citat. Detta beror inte på att de har “bäst” innehåll – det är för att AI-system litar på etablerade, community-validerade källor.