Jeg har brugt betydelig tid på at analysere AI-citeringsmønstre. Her er hvad forskningen viser:
Citeringsfaktorernes vægtning (omtrentligt):
| Faktor | Vægt | Hvad det betyder |
|---|
| Domæneautoritet | 25-30% | Troværdighedssignaler, backlinkprofil, knowledge graph-tilstedeværelse |
| Indholdets aktualitet | 20-25% | Publiceringsdato, opdateringsfrekvens, friske data |
| Semantisk relevans | 20-25% | Hvor direkte indholdet besvarer forespørgslen |
| Informationsstruktur | 15-20% | Overskrifter, lister, tabeller, schema markup |
| Faktuel tæthed | 10-15% | Specifikke datapunkter, statistikker, ekspertcitater |
RAG-processen enkelt forklaret:
- Brugerforespørgsel konverteres til en vektor (numerisk repræsentation)
- Systemet søger efter semantisk lignende indholdsstykker
- Flere faktorer scorer hver potentiel kilde
- De højest scorende kilder bliver citeret i svaret
Vigtig indsigt: I modsætning til traditionel søgning, hvor du konkurrerer om 10 placeringer, er AI-citater mere binære – enten bliver du citeret, eller også gør du ikke. Men flere kilder kan blive citeret, så det er ikke et nulsumsspil.
Autoritetsparadokset:
Forskning viser, at Reddit (40,1%) og Wikipedia (26,3%) dominerer LLM-citater. Det er ikke fordi de har det “bedste” indhold – det er fordi AI-systemer stoler på etablerede, fællesskabsvaliderede kilder.