Lasă-mă să explic detaliile tehnice.
Cum funcționează căutarea vectorială:
Crearea embedding-urilor
- Text → model transformer (BERT, GPT etc.)
- Ieșire: vector cu 768-1536 dimensiuni
- Fiecare dimensiune surprinde o caracteristică semantică
Calcularea similarității
- Textul interogării → vector interogare
- Textul conținutului → vectori conținut
- Similaritatea cosinusului măsoară apropierea
Regăsire
- Găsește cei mai apropiați k vecini
- Returnează conținutul cel mai similar
De ce schimbă asta optimizarea:
Cuvinte cheie: “Pantofi de alergare” potrivește doar “pantofi de alergare”
Vectori: “Pantofi de alergare” potrivește “încălțăminte sport”, “pantofi pentru maraton” etc.
Spațiul semantic:
Conceptele similare se grupează:
- “Software CRM” aproape de “managementul clienților”
- “Startup” aproape de “companie nouă”, “afacere la început”
- “Accesibil” aproape de “buget”, “ieftin”, “economic”
Implicații pentru optimizare:
Acoperă „vecinătatea semantică”, nu doar termenii exacți.