Co sprawia, że treść jest ekstraktowalna:
Dobre do ekstrakcji:
- Jasne, deklaratywne stwierdzenia (“Średnia wynosi X”)
- Samodzielne akapity
- Konkretnie podane dane z kontekstem
- Format pytanie-odpowiedź
- Listy i tabele
- Odpowiednio przypisane twierdzenia
Złe do ekstrakcji:
- Ogólnikowe sformułowania (“wielu ekspertów uważa, że…”)
- Stwierdzenia zależne od kontekstu
- Informacje rozproszone w kilku akapitach
- Dużo żargonu bez wyjaśnienia
- Twierdzenia bez poparcia danymi
Przykład:
Trudne do cytowania:
“Rynek ewoluuje w interesujący sposób, na co wpływa szereg czynników, które niektórzy obserwatorzy określają jako zmianę paradygmatu.”
Łatwe do cytowania:
“Rynek wzrósł o 23% w 2025 roku dzięki trzem czynnikom: wzrostowi wydatków konsumenckich, usprawnieniu łańcucha dostaw i nowym produktom.”
Druga wersja daje ChatGPT jasne, cytowalne stwierdzenie, które można pewnie przypisać.