Logo Tiny Aya de Cohere Labs sur fond vert avec feuillage tropical

Ces modèles IA multilingues ouverts couvrent déjà plus de 70 langues

La startup canadienne Cohere a dévoilé la famille Tiny Aya de modèles multilingues à poids ouverts lors de l’India AI Summit, proposant des systèmes d’IA capables de fonctionner hors ligne sur des ordinateurs portables ordinaires tout en prenant en charge plus de 70 langues, une initiative visant à démocratiser l’accès à l’IA dans les régions à connectivité internet limitée.

Développés par Cohere Labs, la branche de recherche de l’entreprise, les modèles ont été entraînés à l’aide d’un seul cluster de 64 GPU Nvidia H100. Cette approche économique permet aux chercheurs et développeurs dans des environnements aux ressources limitées de déployer l’IA sans nécessiter d’infrastructure informatique massive.

Quatre variantes spécialisées par région

Le modèle de base Tiny Aya contient 3,35 milliards de paramètres, ce qui le rend suffisamment compact pour un déploiement sur appareil tout en conservant une large capacité multilingue.

Diagramme montrant les langues supportées par Tiny Aya organisées par région géographique
Les 70+ langues supportées par Tiny Aya, organisées par région : Asie-Pacifique, Afrique, Asie du Sud, Europe et Asie occidentale

La famille comprend quatre variantes spécialisées : TinyAya-Global, affiné pour les commandes générales dans toutes les langues ; TinyAya-Fire, optimisé pour les langues d’Asie du Sud, notamment le bengali, l’hindi, le pendjabi, l’ourdou, le gujarati, le tamoul, le télougou et le marathi ; TinyAya-Earth, conçu pour les langues africaines comme le zoulou, l’amharique, le haoussa, l’igbo et le swahili ; et TinyAya-Water, couvrant l’Asie-Pacifique, l’Asie occidentale et les langues européennes.

Bon à savoir : Tiny Aya est disponible en « open weight » (poids ouverts), ce qui signifie que les poids des modèles sont téléchargeables et utilisables librement, mais le code d’entraînement complet n’est pas nécessairement open source. Une nuance importante dans l’écosystème de l’IA ouverte.

« Cette approche permet à chaque modèle de développer un ancrage linguistique et une nuance culturelle plus solides, créant des systèmes qui semblent plus naturels et fiables pour les communautés qu’ils sont destinés à servir« , a déclaré Cohere dans un communiqué.

Stratégie de Cohere pour les marchés émergents

Le lancement lors du premier sommet mondial sur l’IA en Inde, la première rencontre de ce type organisée dans les pays du Sud, souligne la volonté stratégique de Cohere de s’implanter dans des marchés linguistiquement diversifiés. L’entreprise torontoise a clôturé l’année 2025 avec 240 millions de dollars (environ 221 millions d’euros) de revenus récurrents annuels et a affiché une croissance de 50% d’un trimestre à l’autre tout au long de l’année.

Le PDG Aidan Gomez a indiqué en octobre dernier que Cohere prévoit d’entrer en bourse « prochainement ». La sortie de Tiny Aya différencie Cohere de ses concurrents, qui se concentrent principalement sur l’échelle des modèles, en ciblant plutôt des déploiements pratiques dans des régions sensibles en matière de confidentialité et confrontées à des limitations de connectivité.

Comment tester

Les modèles sont disponibles en téléchargement sur HuggingFace, Kaggle et Ollama pour un déploiement local, Cohere publiant également les jeux de données d’entraînement et d’évaluation associés ainsi qu’un rapport technique complet.

Vous pouvez tester Tiny Aya directement sur HuggingFace sans installation locale.

Retour en haut