Canonical dévoile le Projet Myna, un outil de dictée vocale IA natif pour Ubuntu Desktop. Sa marque de fabrique ? Une exécution 100% locale, en mémoire, sans envoyer un seul bit de donnée dans le cloud. Présentation.
L’air de rien, en quelques années, la reconnaissance vocale grand public s’est presque entièrement délocalisée dans le cloud, transformant chaque phrase dictée en une donnée potentiellement exploitable. Face à cette dérive, Canonical a choisi d’emprunter une trajectoire radicalement différente pour l’écosystème Linux.
L’éditeur d’Ubuntu vient de présenter le Projet Myna, une initiative open source qui vise à intégrer un système de dictée vocale natif au sein d’Ubuntu Desktop. Tirant son nom du martin-chasseur (myna), un oiseau réputé pour sa capacité à imiter la parole humaine avec clarté, l’outil promet de transcrire la voix directement en texte sans qu’aucune donnée ne transite par internet.
Une reconnaissance vocale étanche et respectueuse de la vie privée
C’est sur le forum communautaire Ubuntu Discourse que Jean-Baptiste Lallement, directeur de l’ingénierie chez Canonical, a officialisé le projet. Conçu à la fois comme un outil de productivité et une avancée majeure en matière d’accessibilité, Myna ambitionne de s’intégrer de manière totalement transparente dans le flux de travail des utilisateurs : un simple raccourci clavier, et le texte dicté s’affiche en temps réel dans l’application active.
La force de l’architecture de Myna repose sur son étanchéité technique :
-
Inférence purement locale : les modèles d’IA légers de reconnaissance vocale s’exécutent directement sur le processeur ou la carte graphique de la machine utilisateur.
-
Zéro connexion requise : une fois les modèles initiaux récupérés, l’application fonctionne de manière totalement déconnectée.
-
Traitement volatile en mémoire : le flux audio capturé par Pipewire est traité exclusivement en mémoire vive et immédiatement purgé après la transcription. Aucun fichier audio n’est stocké localement ou envoyé à des tiers.
-
Contrôle du microphone : le périphérique de capture reste inactif et n’écoute pas en arrière-plan ; il s’active uniquement lorsque la dictée est explicitement déclenchée par l’utilisateur.
Un périmètre ciblé, sous licence GPLv3
Pour éviter l’écueil de l’usine à gaz logicielle, Canonical applique un périmètre fonctionnel strict pour sa première version. Myna se focalise uniquement sur le speech-to-text (la dictée pure). Les fonctionnalités d’assistants virtuels interactifs, les commandes vocales système, les outils de traduction ou même la détection automatique de la langue sont explicitement écartés de la feuille de route initiale.
L’environnement GNOME fonctionnant sous le protocole d’affichage Wayland sert de configuration de référence validée pour le développement, bien que la structure modulaire de l’application soit pensée pour s’adapter à d’autres environnements de bureau à l’avenir.
Sur le plan du code, le projet est distribué sous la très protectrice licence GPLv3. Pour le moment, le dépôt GitHub officiel de Myna héberge principalement les spécifications architecturales et les documents de conception, séparant soigneusement l’interaction utilisateur, l’orchestration audio et l’injection finale du texte.
L’inférence locale comme nouveau standard d’Ubuntu
L’émergence du Projet Myna n’est pas un cas isolé. Elle s’inscrit dans la stratégie globale d’intégration de l’IA menée par Jon Seager, responsable de la stratégie IA chez Canonical. L’objectif affiché est de doter la future version Ubuntu 26.10 « Stonking Stingray », attendue à l’automne, de capacités d’IA contextuelles et locales par défaut.
Fidèle aux orientations récentes de Canonical, ces modules d’inférence logicielle seront distribués sous la forme de paquets Snap optionnels. L’éditeur se veut rassurant pour les puristes et les administrateurs système : les utilisateurs qui ne souhaitent pas encombrer leur système avec ces modèles lourds pourront désactiver et purger l’intégralité des fonctionnalités d’IA locale en une seule commande de terminal.
La conception restant flexible, Canonical invite activement la communauté à remonter ses impressions techniques et ses cas d’usage sur l’annonce communautaire Ubuntu Discourse afin d’affiner la précision du moteur avant le gel du code cet automne.
🦋 L’actualité de l’open source en français dans votre flux. Suivez Goodtech sur Bluesky (ou vos applications AT Protocol comme W Social et Mu) grâce à notre compte officiel. Suivez, partagez, abonnez-vous à @goodtech.info !


… reposted this!