La Fondation Mozilla annonce la sortie de Common Voice 20, une nouvelle version de sa plateforme collaborative visant à rendre les technologies vocales plus inclusives et accessibles à tous. Cette mise à jour porte à 133 langues l’étendue du projet. Comment en profiter et y contribuer ? Voici tout ce qu’il faut savoir.
C’est quoi Common Voice ?
Common Voice est une initiative open source de Mozilla lancée pour créer des jeux de données vocales accessibles à tous. Contrairement aux solutions propriétaires, Common Voice s’appuie sur la contribution de volontaires du monde entier pour enregistrer et valider des extraits de voix. Ces données servent ensuite à entraîner des modèles de reconnaissance vocale plus diversifiés, ouverts et inclusifs.
Comme nous l’avions évoqué dans un précédent article, Mozilla cherche en particulier à récolter des voix francophones pour enrichir ses jeux de données et mieux représenter la diversité des accents et des dialectes. (Lire notre article : Common Voice de Mozilla a besoin de voix francophones).
Common Voice 20 : les nouveautés
Ce jeu de données inclut pour la première fois l’aragonais, l’isindebele, le sotho du sud et le tupuri. Ces nouvelles langues portent à 133 le nombre total de langues dans le jeu de données Common Voice Scripted Speech.
Cette version inclut les contributions faites jusqu’au 6 décembre 2024 et ajoute 566 nouvelles heures de parole et 515 heures de parole nouvellement validées. Cela porte le nombre total d’heures de données vocales disponibles dans le jeu de données Common Voice à 33 150 heures. 22 108 heures ont fait l’objet d’une assurance qualité (« validation ») par la communauté.
Comment participer au projet ?
Contribuer à Common Voice est simple, ouvert à tous et ne nécessite aucune compétence technique. Voici comment vous pouvez participer :
- Enregistrer votre voix : lisez à haute voix des phrases proposées par la plateforme. Chaque contribution compte et enrichit les jeux de données.
- Valider les enregistrements : écoutez les extraits d’autres participants et validez-les pour garantir leur qualité.
- Proposer des phrases : soumettez de nouvelles phrases pour diversifier les contenus à enregistrer.
Mozilla organise également des événements pour sensibiliser et mobiliser les contributeurs. Par exemple, lors d’un récent séminaire en ligne, Mozilla a présenté ses avancées et expliqué comment chacun peut aider à développer des technologies vocales plus inclusives (voir notre article).
Pour rejoindre le projet, rendez-vous sur le site officiel de Common Voice et commencez à contribuer en quelques clics.

