FLARE : Génération augmentée par récupération active
FLARE (EMNLP 2023) améliore le RAG standard en déclenchant la récupération en cours de génération à l'aide de seuils de confiance de probabilité de jetons, atteignant 51,0 EM sur 2WikiMultihopQA contre 39,4 pour la récupération unique — mais les échecs de calibration dans les modèles de chat optimisés pour les instructions limitent sa fiabilité pour les agents financiers en production.
