Fine-tuning
Technique consistant a re-entrainer un modele pre-entraine sur des donnees specifiques pour l'adapter a une tache precise.
Le fine-tuning est le processus d'adaptation d'un modele pre-entraine en le re-entrainant sur un jeu de donnees specifique a votre domaine ou tache.
Types de fine-tuning :
- • Full fine-tuning : re-entraine tous les parametres (couteux)
- • LoRA : n'entraine que de petites matrices ajoutees au modele (efficace)
- • QLoRA : LoRA sur un modele quantifie (tres economique)
- • RLHF : affinage par feedback humain (utilise pour ChatGPT)
Quand fine-tuner :
- • Adapter le style ou le ton de l'IA
- • Specialiser le modele pour un domaine (medical, juridique...)
- • Ameliorer les performances sur une tache specifique
- • Reduire les hallucinations sur votre domaine
Le fine-tuning est devenu accessible grace a des outils comme Hugging Face, OpenAI Fine-tuning API, et des techniques comme LoRA qui reduisent drastiquement les ressources necessaires.