IBM vient de publier Granite 4.0, la nouvelle génération de ses modèles de langage d’entreprise. Un lancement qui confirme un positionnement rare dans le secteur : la priorité donnée à l’open source. Les modèles Granite 4.0 restent sous licence Apache 2.0, avec un code et des poids vérifiables, disponibles publiquement sur Hugging Face et sur la page officielle du projet Granite.
Cette version marque une avancée majeure dans la quête d’un modèle efficace, léger et plus transparent. Granite 4.0 adopte une architecture hybride associant Mamba-2 et Transformers, qui permet de réduire de 70 % la mémoire nécessaire à l’inférence tout en doublant la vitesse d’exécution. Concrètement, cela signifie que les modèles peuvent fonctionner sur des GPU beaucoup plus abordables, et même sur des serveurs locaux ou des environnements edge, sans compromis sur la qualité.
IBM a également obtenu la certification ISO/IEC 42001:2023, une première mondiale pour un modèle de langage open source. Cette norme encadre la gouvernance, la transparence et la sécurité des systèmes d’IA, garantissant une traçabilité totale du processus de développement. Pour renforcer cette confiance, tous les points de contrôle des modèles Granite 4.0 sont désormais signés cryptographiquement, une démarche qui permet de vérifier leur authenticité avant toute utilisation.
Du côté des performances, Granite 4.0 surpasse la génération précédente (Granite 3.3) sur la plupart des tâches, tout en restant bien plus compact. Les modèles Small, Tiny et Micro sont conçus pour des scénarios d’entreprise concrets : agents autonomes, automatisation du support client ou génération de code. Et surtout, IBM s’engage à maintenir une interopérabilité complète : Granite 4.0 fonctionne déjà dans vLLM, llama.cpp, MLX et d’autres environnements open source.
