Comment Firefox accélère enfin son moteur d’IA local (en open source)

Mozilla continue d’intégrer l’intelligence artificielle directement dans Firefox, mais sans dépendre du cloud. Depuis l’an dernier, le navigateur embarque son propre Firefox AI Runtime, un moteur local qui alimente discrètement certaines fonctionnalités comme la génération automatique de texte alternatif dans les PDF ou le regroupement intelligent d’onglets.

Jusqu’ici, ce moteur reposait sur Transformers.js, une bibliothèque connectée à onnxruntime-web, une version WebAssembly de l’environnement ONNX Runtime. Mais cette approche avait des limites de performance, notamment lors des premiers lancements où les calculs restaient lents. Mozilla a donc choisi de remplacer cette couche par une intégration native en C++. Concrètement, cela permet aux modèles d’IA de tirer parti des instructions matérielles avancées des processeurs modernes, comme AVX-512 sur Intel ou NEON sur Apple Silicon.

Les gains sont spectaculaires, selon les développeurs : selon Mozilla, l’inférence peut aller jusqu’à dix fois plus vite. Par exemple, un modèle d’image vers texte utilisé dans les PDF passe d’une latence de 3,5 secondes à seulement 350 millisecondes. Au-delà de cette première étape, Mozilla prévoit d’étendre cette intégration à d’autres fonctions et d’exploiter bientôt les GPU pour encore plus de vitesse. L’équipe travaille également sur des optimisations comme le multi-threading et la mise en cache des graphes compilés.

Avec ces évolutions, Firefox confirme une approche singulière : apporter l’IA directement dans le navigateur, en local, en s’appuyant sur des briques open source comme ONNX et Transformers.js. De quoi offrir des fonctionnalités intelligentes plus rapides, tout en renforçant la confidentialité des utilisateurs, puisque les données restent sur l’appareil.

Retour en haut