Cette annonce va laisser des traces. Google DeepMind a frappé un grand coup en lançant Gemma 4, une nouvelle famille de modèles d’IA « à poids ouverts » (open weights). Basés sur la technologie de pointe de Gemini 3, ces modèles sont libérés sous licence Apache 2.0, offrant une puissance inédite aux développeurs, tout en ciblant directement la domination récente des modèles chinois comme DeepSeek ou Qwen.
Sous la direction d’Olivier Lacombe et Clement Farabet, l’équipe de Google DeepMind n’a pas fait les choses à moitié. Gemma 4 se décline en quatre tailles pour s’adapter à toutes les infrastructures :
-
Effective 2B et 4B : taillés pour l' »Edge », ces modèles tournent nativement sur mobiles, Raspberry Pi ou Jetson Nano avec une latence quasi nulle.
-
26B Mixture of Experts (MoE) : un monstre d’efficacité qui n’active que 3,8 milliards de paramètres lors de l’inférence pour une vitesse foudroyante.
-
31B Dense : le fer de lance de la gamme, conçu pour maximiser la qualité brute et servir de base aux réglages les plus fins (fine-tuning).
Le point commun ? Ils tiennent tous sur un seul GPU Nvidia H100 (80 Go), démocratisant l’accès à une IA de rang mondial sans nécessiter une ferme de serveurs.

Le mystère de la « Loutre Significative » résolu
Depuis quelques jours, un modèle anonyme nommé « significant-otter« affolait le classement LMSYS Chatbot Arena. C’était en réalité Gemma 4. Les résultats sont désormais officiels : le modèle Dense 31B se classe 3e mondial au classement général Arena AI, surpassant des modèles pourtant 20 fois plus volumineux.
Dans le segment open source, Google reprend enfin l’avantage sur les laboratoires chinois. Clément Delangue, PDG de Hugging Face, ne cache pas son enthousiasme : « La sortie de Gemma 4 sous licence Apache 2.0 est une étape monumentale. Nous sommes incroyablement excités de soutenir cette famille dès le premier jour. »
Capacités agentiques : l’IA qui agit enfin par elle-même
Gemma 4 ne se contente pas de discuter ; il est conçu pour l’action. Contrairement à ses prédécesseurs, cette génération traite nativement la vidéo, l’image, l’audio et le texte. Mais sa véritable force réside dans ses fonctions « agentiques » : le support natif de l’appel de fonctions (function-calling), la génération de JSON structuré et les instructions système permettent de créer des agents autonomes capables d’interagir avec des API réelles. Avec des fenêtres de contexte allant de 128K à 256K, vous pouvez désormais lui confier des répertoires entiers de code ou des documents massifs en un seul prompt.
Avec déjà 400 millions de téléchargements pour les versions précédentes, Google capitalise sur une communauté assez solide et engagée. Des projets concrets comme BgGPT (un modèle dédié au bulgare) ou des recherches sur le cancer avec l’Université de Yale montrent que l’IA ouverte est le moteur de l’innovation souveraine.
Gemma 4 est disponible immédiatement via Google AI Studio, mais aussi (on l’a compris) sur Hugging Face, Nvidia NIM et Ollama. Bref, le « cerveau » de Gemini 3 est désormais à votre disposition, gratuitement et… sans barrières restrictives. Pourvu que ça dure ?
