Nebius lance Token Factory, une plateforme pour industrialiser l’IA open source

La société européenne Nebius vient de présenter Token Factory, une nouvelle plateforme conçue pour déployer et optimiser des modèles d’IA open source à grande échelle. L’objectif : transformer les prototypes de modèles en systèmes d’inférence prêts pour la production, avec des garanties de sécurité et de performance dignes des grands environnements d’entreprise.

Construite sur l’infrastructure d’IA maison de Nebius (basée à Amsterdam), Token Factory réunit dans un même environnement tout le cycle de vie des modèles : du fine-tuning à l’inférence, en passant par la gestion des accès et la supervision. Elle prend en charge plus de 60 modèles ouverts — dont DeepSeek, Llama, GPT-OSS (par OpenAI), Qwen et NVIDIA Nemotron— et permet aussi aux clients d’héberger leurs propres modèles personnalisés.

Avec des performances garanties (99,9 % de disponibilité), une latence sous la seconde et un débit évolutif automatiquement, la plateforme est pensée pour absorber des charges massives — jusqu’à des centaines de millions de requêtes par minute. Nebius cible ainsi un problème bien connu : les entreprises qui veulent passer de l’expérimentation à la production se heurtent souvent à la complexité technique des modèles ouverts. Token Factory veut combiner la flexibilité de l’open source avec la gouvernance et la fiabilité des environnements propriétaires.

Des gains spectaculaires et un écosystème déjà actif

Plusieurs entreprises testent déjà la solution. Le conglomérat Prosus, maison mère de nombreuses marques e-commerce et médias, annonce avoir réduit ses coûts d’exploitation jusqu’à 26 fois par rapport aux modèles propriétaires, tout en gérant jusqu’à 200 milliards de jetons par jour. La plateforme vidéo Higgsfield AI s’appuie sur Nebius pour sa capacité d’autoscaling et sa gestion simplifiée.

Côté communauté, Hugging Face collabore avec Nebius pour rendre les modèles open source plus accessibles et performants pour les développeurs.

Token Factory intègre des fonctionnalités de fine-tuning complet ou LoRA, un hébergement à rétention zéro dans des datacenters situés en Europe ou aux États-Unis, et des certifications de sécurité de haut niveau (SOC 2 Type II, ISO 27001, HIPAA). Elle introduit également des outils de gouvernance comme la gestion d’équipe, le Single Sign-On (SSO) et une facturation unifiée.

Les utilisateurs de Nebius AI Studio migreront automatiquement vers Token Factory, qui devient le nouveau socle de la stratégie IA du groupe.

Retour en haut