tuto murmure transcription speech to text local
  • 5 mars 2026
  • ComputaSYS
  • 0


La dictée vocale, appelée aussi Speech-to-Text, est un gain de temps au quotidien et elle est de plus en plus utilisée, que ce soit pour prendre des notes, rédiger un compte rendu ou encore un e-mail. Comme pour d’autres tâches, l’IA vient renforcer l’efficacité de cette pratique en simplifiant le processus. Mais, comment sécuriser la dictée vocale en utilisant uniquement les ressources vocales ? La réponse s’appelle Murmure.

Dans ce tutoriel, nous allons découvrir Murmure, un outil open source gratuit qui permet de transcrire votre voix en texte directement sur votre machine, sans aucune connexion Internet. En effet, Murmure s’appuie uniquement sur les ressources locales de la machine, même s’il s’appuie sur l’intelligence artificielle.

Murmure : la reconnaissance vocale locale et privée

Murmure est une application multiplateforme (Windows, Linux, macOS) conçue avec une philosophie “Privacy First”. En effet, contrairement à d’autres outils qui ne sont que des interfaces vers des API payantes, Murmure mise tout sur le traitement des données en local, et donc sur la confidentialité.

Quand il s’agit de transcription ou d’opération de Speech-to-Text, il y a un modèle qui revient souvent : Whisper d’OpenAI. Néanmoins, Murmure ne l’utilise pas ! En effet, à la place, c’est un autre modèle qui est utilisé : NVIDIA Parakeet (modèle TDT 0.6B v3). Il est également spécialisé dans les opérations de transcription.

L’avantage de ce modèle de langage, c’est qu’il est léger et adapté pour tourner sur des machines avec une configuration standard (2 Go de RAM et 1 Go de disque). De plus, Parakeet est conçu pour une transcription en temps réel avec une latence très faible, ce qui est idéal pour de la dictée au fil de l’eau. Le choix de Murmure de s’appuyer sur Parakeet semble judicieux dans le contexte de la dictée locale.

Le point fort de l’outil Murmure réside dans le fait de réaliser tout le traitement en local. Aucune donnée audio, aucune télémétrie et aucun texte transcrit ne quittent votre ordinateur ! Il peut donc fonctionner en ligne, sans connexion réseau, tout en prenant en charge 25 langues européennes différentes.

Pour aller plus loin avec Murmure, sachez que vous pouvez l’interfacer avec Ollama pour solliciter un autre modèle de langage (LLM), toujours en s’appuyant sur les ressources locales.

Installation de Murmure

J’ai testé Murmure sur Windows. L’installation s’effectue en quelques minutes en récupérant l’exécutable prêt à l’emploi disponible sur le GitHub du projet. Ensuite, l’outil est directement prêt à l’emploi pour de la dictée vocale.

Il y a deux raccourcis pour activer l’enregistrement et commencer la dictée vocale :

CTRL + Espace : dictée vocale via NVIDIA Parakeet (natif)

CTRL + Alt + Espace : dictée vocale via le LLM de votre choix en s’appuyant sur Ollama (nécessite de la configuration en plus)

Cela signifie que Murmure fonctionne selon le principe Push-to-Talk : il ne vous écoute pas en continu (contrairement aux assistants vocaux). Il fonctionne sur le principe du déclenchement manuel.

Prise en main de Murmure

Murmure présente une interface épurée, avec un menu sur la gauche et un affichage des informations sur la partie centrale. L’interface est disponible en français et en anglais.

Les paramètres de l’application permettent de changer la langue, de choisir le micro pour l’enregistrement ou encore de définir un mode d’enregistrement. Deux modes sont proposés :

Mode “Hold” : maintenez les touches enfoncées pour parler, relâchez pour transcrire.

Mode “Toggle” : appuyez une fois pour démarrer l’enregistrement, appuyez à nouveau pour arrêter. Ce mode apporte plus de confort lors des longues dictées.

Le mode “Hold” est configuré par défaut.

Note : la qualité du micro peut influencer le taux d’erreur de la transcription. En effet, un micro intégré sur un ordinateur portable fonctionnera, mais la qualité audio souvent faible pourra impacter la qualité de la transcription.

Ce qui est appréciable, c’est qu’il n’y a pas à attendre, c’est très réactif. L’exemple ci-dessous est propre, et même si la ponctuation pourrait être améliorée, le texte est correct dans son intégralité.

“Alors quelles sont les options disponibles dans Murmure Eh bien déjà nous avons des règles de formatage. On peut par exemple ajouter un espace avant un point d’interrogation et après un point d’exclamation. On peut même lui dire de convertir les nombres en chiffres, on peut ajouter des règles personnalisées et même définir notre propre dictionnaire avec des mots-clés, des noms propres, des noms de produits ou des choses comme ça.”

Au sein de l’application, il suffit de cliquer sur une transcription pour la copier dans le presse-papier.

Donc, en effet, vous pouvez spécifier des règles de formatage et alimenter un dictionnaire de mots personnalisés (que vous pouvez importer). Pour le moment, les noms avec des caractères spéciaux ne sont pas pris en charge. Par exemple, je n’ai pas pu ajouter “IT-Connect” à cause du tiret. Dommage.

Dans tous les cas, dans un contexte technique, le vocabulaire est souvent spécifique (acronymes, jargon). Il est donc essentiel d’alimenter le dictionnaire pour améliorer le taux de précision de Murmure, et ainsi éviter qu’il échoue sur certains noms, comme des noms de produit. Même si j’avoue qu’il a fait un sans-faute sur cet enchaînement (résultat tel quel renvoyé par Murmure) :

Windows, Linux, Ansible, Mac OS, Docker, Kubernetes, Jenkins, Visual Studio Code, Proton Mail, Discord, Firefox.

Le résultat de la transcription n’est pas forcément retourné dans Murmure. C’est là où ça devient encore plus intéressant : vous pouvez écrire n’importe où, que ce soit sur un client de messagerie, un post sur les réseaux sociaux ou même un article de blog !

Connexion de Murmure avec un LLM local (Ollama)

Murmure peut s’interfacer avec Ollama, un outil permettant de faire tourner des IA génératives (comme Llama 3 ou Mistral) en local. L’intérêt de cette intégration étant d’aller plus loin : vous pouvez demander à Murmure non seulement de transcrire ce que vous dites, mais de le post-traiter automatiquement grâce à un prompt spécifique.

Exemple de configuration :

Assurez-vous qu’Ollama est installé et tourne sur votre machine.

Dans Murmure, activez l’option “Connexion LLM”.

Vous pouvez créer des “Prompts” (consignes) spécifiques. Par exemple :

Prompt “Correction” : “Corrige la grammaire et la ponctuation du texte suivant, sans changer le sens.”

Prompt “Développeur” : “Le texte dicté est un commentaire de code, formate-le pour qu’il soit inséré dans du code Python.”

Prompt “Synthèse” : “Reformule ce texte de manière plus formelle pour un email professionnel.”

Une fois configuré, vous dictez votre texte “en vrac”, et quelques secondes après, c’est une version corrigée et formatée qui s’insère dans votre éditeur de texte. L’inconvénient, c’est que votre machine est nettement plus sollicitée, donc il y a une “latence” plus ou moins importante liée au temps de traitement. Cela dépend des ressources de votre machine (RAM, GPU…) et du modèle sélectionné.

Conclusion

Murmure est une bonne découverte pour tous ceux qui veulent allier dictée vocale et transcription par IA avec le respect de la vie privée et de la confidentialité. L’outil parvient à combiner la puissance de l’IA avec une exécution totalement locale. C’est un projet open source, alors n’hésitez pas à consulter le code (mix en TypeScript et Rust) et à contribuer.

Qu’en pensez-vous ?

Ingénieur système et réseau, cofondateur d’IT-Connect et Microsoft MVP “Cloud and Datacenter Management”. Je souhaite partager mon expérience et mes découvertes au travers de mes articles. Généraliste avec une attirance particulière pour les solutions Microsoft et le scripting. Bonne lecture.



Source link

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *