Lad mig forklare RAG på så enkel vis som muligt.
Biblioteks-analogien:
Forestil dig, at en AI er en meget klog person, der læste millioner af bøger for år tilbage (træningsdata). De kan svare på mange spørgsmål ud fra hukommelsen.
Men hvad nu hvis du spørger om noget, der skete i sidste uge? Det ved de ikke – de husker kun, hvad de læste før.
RAG er som at give den person en bibliotekar-assistent.
Når du stiller et spørgsmål, løber bibliotekaren ud og finder relevante bøger og rækker de relevante sider til den kloge person. Nu kan de svare ved at bruge både deres viden OG den aktuelle information.
Sådan fungerer det teknisk (forenklet):
- Du stiller et spørgsmål
- Et retrieval-system søger efter relevant indhold (dit website, artikler, dokumenter)
- Relevante tekststykker trækkes ud og gives til AI’en
- AI’en genererer et svar ud fra de hentede stykker
- Den citerer, hvor informationen kommer fra
For indholdsskabere:
Dit indhold kan blive “hentet” og brugt til at besvare spørgsmål med det samme – ikke kun hvis/når det bliver en del af træningsdata.
Derfor betyder indholdsstruktur så meget. Retrieval-systemet skal kunne finde dit indhold OG udtrække de rigtige dele.