Zero-shot
Capacite d'un modele a effectuer une tache sans aucun exemple prealable, uniquement a partir de l'instruction.
Le zero-shot designe la capacite d'un modele d'IA a effectuer une tache sans avoir vu aucun exemple de cette tache specifique. Le modele se base uniquement sur ses connaissances generales et l'instruction fournie.
Exemple :
- • Prompt : "Classe ce texte comme positif, negatif ou neutre : 'Le service etait deplorable'"
- • Reponse : "Negatif"
- • Le modele n'a recu aucun exemple de classification, mais comprend la tache grace a ses connaissances pre-existantes.
Le zero-shot est une capacite emergente des grands modeles de langage. Plus un modele est grand, meilleures sont ses performances en zero-shot. C'est ce qui rend les LLM si polyvalents : ils peuvent effectuer des taches pour lesquelles ils n'ont jamais ete specifiquement entraines.