Fine-tuning

Le fine-tuning est le processus d'adaptation d'un modele pre-entraine en le re-entrainant sur un jeu de donnees specifique a votre domaine ou tache.

Types de fine-tuning :

• Full fine-tuning : re-entraine tous les parametres (couteux)
• LoRA : n'entraine que de petites matrices ajoutees au modele (efficace)
• QLoRA : LoRA sur un modele quantifie (tres economique)
• RLHF : affinage par feedback humain (utilise pour ChatGPT)

Quand fine-tuner :

• Adapter le style ou le ton de l'IA
• Specialiser le modele pour un domaine (medical, juridique...)
• Ameliorer les performances sur une tache specifique
• Reduire les hallucinations sur votre domaine

Le fine-tuning est devenu accessible grace a des outils comme Hugging Face, OpenAI Fine-tuning API, et des techniques comme LoRA qui reduisent drastiquement les ressources necessaires.

Ressources externes

Termes lies

LoRA (Low-Rank Adaptation)

RLHF (Reinforcement Learning from Human Feedback)

Transfer Learning

LLM (Large Language Model)