Le géant chinois de l’e-commerce Alibaba (9988.HK) a annoncé mercredi que son modèle d’intelligence artificielle générative Wan 2.1, spécialisé dans la création d’images et de vidéos, est désormais disponible en open source et l’entreprise ne compte pas s’arrêter là. Cette décision stratégique devrait accélérer son adoption et intensifier la concurrence dans le secteur de l’IA générative.
L‘annonce d’Alibaba s’inscrit dans une tendance émergente, faisant suite à l’initiative similaire de la startup DeepSeek, dont les modèles open source à coûts réduits ont généré un enthousiasme considérable parmi les investisseurs technologiques en début d’année. Ces modèles ont surpris l’industrie par leurs performances comparables à celles de concurrents plus établis comme OpenAI, malgré les investissements massifs habituellement nécessaires dans ce secteur.
Cette ouverture peut sembler contre-intuitive dans un domaine où la propriété intellectuelle représente un atout majeur, mais elle répond à une double ambition : accélérer le développement via une communauté élargie de chercheurs et de développeurs, tout en favorisant une adoption mondiale des technologies d’Alibaba.
Le contexte : Alibaba avait introduit la dernière version de son modèle de génération d’images et de vidéos en janvier — raccourcissant ultérieurement son nom de Wanx à Wan — en vantant sa capacité à générer des visuels hautement réalistes. L’entreprise a depuis mis en avant son classement de premier plan sur VBench, un tableau de référence pour les modèles génératifs vidéo, où elle excelle dans des fonctionnalités telles que l’interaction multi-objets.
Quatre variantes pour différents usages
Alibaba a précisé avoir mis à disposition quatre variantes du modèle Wan 2.1 :
- T2V-1.3B
- T2V-14B
- I2V-14B-720P
- I2V-14B-480P
Ces modèles permettent de générer des images et des vidéos à partir de texte et d’images existantes. La mention « 14B » indique que la variante accepte 14 milliards de paramètres, ce qui lui permet de traiter beaucoup plus d’entrées pour produire des résultats plus précis.
Les modèles sont disponibles sur les plateformes ModelScope d’Alibaba Cloud et HuggingFace, pour des usages académiques, de recherche et commerciaux.
Un investissement massif dans l’IA et le choix de l’open source
En parallèle de cette annonce, Alibaba a dévoilé mardi une préversion de son modèle de raisonnement QwQ-Max, qu’elle prévoit également de rendre open source lors de sa sortie complète. Le groupe a également annoncé cette semaine son intention d’investir au moins 380 milliards de yuans (48,7 milliards d’euros) au cours des trois prochaines années pour renforcer son infrastructure de cloud computing et d’IA, démontrant ainsi son engagement à long terme dans ces technologies.
L’open source n’est pas seulement une question de philosophie ou de stratégie marketing : c’est aussi un levier économique dans un marché où la pression sur les coûts s’intensifie. Avec des startups comme DeepSeek proposant des solutions d’IA à des tarifs nettement inférieurs aux standards du marché, l’accessibilité financière devient un facteur clé de compétitivité.
Pour les entreprises et les développeurs indépendants, cette tendance représente une opportunité significative : l’accès à des modèles avancés sans les coûts prohibitifs imposés par certains géants technologiques. En réduisant les barrières financières, Alibaba stimule l’innovation décentralisée tout en développant un écosystème autour de ses propres technologies.
La mise en open source de Wan 2.1 participe donc à une stratégie plus large : contribuer aux ambitions nationales d’indépendance technologique tout en naviguant entre innovation et contrôle étatique. Cette approche pourrait inspirer d’autres acteurs chinois, tout en restant alignée avec les priorités de Pékin en matière de développement technologique.
