Ich erkläre RAG mal so einfach wie möglich.
Die Bibliotheks-Analogie:
Stellen Sie sich eine KI als sehr klugen Menschen vor, der vor Jahren Millionen von Büchern gelesen hat (Trainingsdaten). Sie kann viele Fragen aus dem Gedächtnis beantworten.
Aber was, wenn Sie nach etwas fragen, das letzte Woche passiert ist? Das weiß die Person nicht – sie erinnert sich nur an das, was sie früher gelesen hat.
RAG ist wie ein Bibliothekar-Assistent für diese Person.
Wenn Sie eine Frage stellen, rennt der Bibliothekar los, sucht relevante Bücher und reicht die passenden Seiten dem klugen Menschen. Jetzt kann er mit seinem Wissen UND aktuellen Informationen antworten.
Wie es technisch funktioniert (vereinfacht):
- Sie stellen eine Frage
- Ein Retrieval-System sucht nach relevanten Inhalten (Ihre Website, Artikel, Dokumente)
- Relevante Textstücke werden herausgezogen und der KI übergeben
- Die KI generiert eine Antwort mit diesen abgerufenen Inhalten
- Sie nennt die Quelle, woher die Information stammt
Für Content-Ersteller:
Ihre Inhalte können JETZT abgerufen und für Antworten genutzt werden – nicht nur, wenn/wenn sie ins Training gelangen.
Deshalb ist Struktur bei Inhalten so wichtig. Das Retrieval-System muss Ihre Inhalte finden UND die richtigen Teile extrahieren können.