Juste avant la grande vague de voyages de mai en Chine le week-end dernier, Tencent a fait un cadeau de taille à la communauté des développeurs et des voyageurs. Le géant technologique a publié en open source Hy-MT1.5-1.8B-1.25bit, un modèle de traduction capable de faire tenir 1,8 milliard de paramètres dans seulement 440 Mo.
Pour donner un ordre d’idée, c’est environ un huitième de sa taille d’origine. Ce régime draconien permet à l’intelligence artificielle de fonctionner intégralement hors ligne sur un smartphone, garantissant des traductions instantanées sans dépendre du cloud ou d’un forfait data onéreux à l’étranger.
Cette prouesse technique repose sur un nouveau framework de quantification baptisé Sherry, présenté lors de la conférence ACL 2026. En utilisant une technique de « sparsité fine 3:4 », les chercheurs ont réussi à réduire la précision moyenne à seulement 1,25 bit par paramètre. Associé à un noyau d’inférence optimisé pour les processeurs mobiles, ce modèle peut tourner en arrière-plan sans épuiser la mémoire vive de l’appareil. Pour ceux qui craindraient une perte de qualité trop importante, Tencent propose également une variante de 574 Mo (2 bits) qui préserve une précision quasi parfaite par rapport au modèle original.
Un champion du monde dans votre téléphone
Le modèle Hy-MT1.5 n’est pas un simple gadget de démonstration. Il s’agit d’une évolution du système de traduction de Tencent, sacré champion lors de la compétition WMT25. Il prend en charge nativement 33 langues et plus de 1 000 directions de traduction, incluant des dialectes chinois et des langues minoritaires souvent négligées par les services grand public. Selon les tests de benchmarks, ce petit modèle de 1,8 milliard de paramètres parvient à égaler des API commerciales gigantesques dotées de plus de 200 milliards de paramètres, surpassant même Google Translate sur plusieurs critères de qualité.
Au-delà de la performance, Tencent joue la carte de la souveraineté et de la confidentialité. En publiant le modèle sur GitHub et Hugging Face, l’entreprise permet à chacun d’auditer le code. L’application de démonstration, actuellement disponible sur Android via ModelScope, propose un mode de capture de mots en arrière-plan très pratique pour traduire des e-mails ou des pages web à la volée. L’intégralité du traitement étant effectuée localement, aucune donnée personnelle ne quitte jamais le smartphone. Vous pouvez tester la puissance du moteur directement via la démo officielle ou consulter le site web de Hunyuan pour explorer le reste de la gamme.
La fin des géants centralisés ?
On l’a vu la semaine dernière avec Frugalia : cette sortie confirme une tendance lourde de l’année 2026, à savoir la « small-modelisation » de l’IA. Si la course à la puissance brute continue dans le cloud, la véritable bataille pour l’usage quotidien se gagne sur l’appareil (on-device). En rendant son traducteur champion du monde accessible hors ligne, Tencent ne propose pas seulement un outil pratique, il s’attaque au monopole des services cloud américains. C’est une brique de plus pour l’indépendance numérique des utilisateurs, même si l’on attend encore avec impatience une prise en charge complète pour iOS pour que la révolution soit totale.

