Zero-shot

Le zero-shot designe la capacite d'un modele d'IA a effectuer une tache sans avoir vu aucun exemple de cette tache specifique. Le modele se base uniquement sur ses connaissances generales et l'instruction fournie.

Exemple :

• Prompt : "Classe ce texte comme positif, negatif ou neutre : 'Le service etait deplorable'"
• Reponse : "Negatif"
• Le modele n'a recu aucun exemple de classification, mais comprend la tache grace a ses connaissances pre-existantes.

Le zero-shot est une capacite emergente des grands modeles de langage. Plus un modele est grand, meilleures sont ses performances en zero-shot. C'est ce qui rend les LLM si polyvalents : ils peuvent effectuer des taches pour lesquelles ils n'ont jamais ete specifiquement entraines.

Ressources externes

Termes lies

Few-shot Learning

Prompt Engineering

LLM (Large Language Model)