RAG (Retrieval-Augmented Generation)
Technique qui enrichit les reponses d'une IA en recuperant des informations pertinentes dans une base de donnees externe.
Le RAG (Retrieval-Augmented Generation) est une technique qui ameliore les reponses d'un LLM en lui fournissant des informations pertinentes extraites d'une base de connaissances externe au moment de la requete.
Fonctionnement en 3 etapes : 1. Retrieval : recherche des documents pertinents dans une base vectorielle 2. Augmentation : injection des documents trouves dans le prompt 3. Generation : le LLM genere sa reponse en s'appuyant sur ces documents
Avantages du RAG :
- • Reduction des hallucinations : le modele s'appuie sur des faits reels
- • Mise a jour facile : pas besoin de re-entrainer le modele
- • Sources citables : les reponses peuvent pointer vers les documents source
- • Couts reduits : pas de fine-tuning necessaire
Le RAG est devenu la methode standard pour construire des chatbots d'entreprise qui doivent repondre sur des documents internes.