Récupération basée sur les embeddings :
Oui, exactement. Le processus :
- La requête est convertie en embedding (vecteur numérique)
- Le vecteur est comparé aux embeddings des documents
- La recherche de similarité renvoie les meilleures correspondances
- Les résultats peuvent ne pas partager les mots exacts de la requête
Traitement multi-sources :
Perplexity traite les sources en parallèle, pas séquentiellement :
Docs récupérés (5-10 sources)
↓
Extraction parallèle des passages pertinents
↓
Classement des passages par pertinence
↓
Contexte combiné + requête → LLM
↓
Réponse synthétisée avec citations intégrées
Le mécanisme de citation :
Au fur et à mesure que le LLM génère chaque affirmation, il maintient l’attribution de la source. C’est pourquoi les citations apparaissent en ligne – le modèle suit quelle source soutient chaque affirmation.
Résolution des conflits :
Lorsque les sources divergent, Perplexity :
- Présente souvent plusieurs points de vue
- Signale le désaccord
- Pondère selon la crédibilité de la source