Speech-to-Text (STT)
Technologie de reconnaissance vocale convertissant la parole en texte ecrit.
Le Speech-to-Text (STT), ou reconnaissance automatique de la parole (ASR), est la technologie qui convertit la parole humaine en texte ecrit.
Solutions STT modernes :
- • Whisper (OpenAI) : open source, multilingue, tres precis
- • Google Speech-to-Text : temps reel, 125+ langues
- • Azure Speech (Microsoft) : enterprise, personnalisable
- • AssemblyAI : API specialisee, diarization
- • Deepgram : rapide, temps reel
Capacites :
- • Transcription temps reel ou en batch
- • Diarization (identification des locuteurs)
- • Detection de la langue
- • Ponctuation automatique
- • Reconnaissance de termes specifiques
Applications : sous-titrage automatique, dictee vocale, transcription de reunions, centres d'appel, accessibilite. Whisper d'OpenAI a democratise le STT de haute qualite grace a sa nature open source.