Qwen 2.5 : 100 modèles open source dévoilés pour l’IA d’Alibaba Cloud

C’est à l’occasion d’Apsara Conference, son événement annuel phare, qu’Alibaba Cloud vient d’annoncer la disponibilité de Qwen 2.5. L’entreprise chinoise en a profité pour faire passer en open source plus de 100 de ses nouveaux grands modèles de langage.

La série de modèles Qwen connaît un vif succès en Chine depuis son lancement en avril 2023. Selon l’éditeur, à ce jour, les modèles ont été téléchargés plus de 40 millions de fois sur des plateformes telles que Hugging Face et ModelScope, une initiative communautaire open source lancée par Alibaba. Ces modèles ont inspiré la création de plus de 50 000 modèles sur Hugging Face.

La semaine dernière, Alibaba Cloud a annoncé une toute nouvelle infrastructure pour répondre aux demandes croissantes en matière de calculs robustes pour l’IA. C’est dans ce même cadre que Jingren Zhou, le directeur technologique du groupe, a dévoilé les nouveaux modèles open-source Qwen 2.5.

Quoi de neuf dans Qwen 2.5 ?

Les modèles open-source Qwen 2.5 – accessibles via Github – varient en taille de 0,5 à 72 milliards de paramètres. Ils possèdent des connaissances améliorées et des capacités renforcées en mathématiques et en codage. Ils peuvent prendre en charge plus de 29 langues (dont le français !), avec quelques secteurs de prédilection (sans exclusive !), tels que l’automobile, les jeux vidéo et la recherche scientifique.

Objectif : ne plus faire de la figuration face aux acteurs américains dominants sur le marché d’ lA.

Avec la sortie de Qwen 2.5, plus de 100 modèles sont mis en open source. On compte des modèles de base, des modèles instructifs et des modèles quantifiés avec divers niveaux de précision et de méthodes, pour le langage, l’audio et la vision, ainsi que des modèles spécialisés pour le code et les mathématiques.

Alibaba Cloud a également annoncé une mise à jour de son modèle phare (Ndlr : qui est, lui, propriétaire) Qwen-Max. Cemodèle amélioré afficherait des performances comparables à celles d’autres modèles de pointe dans des domaines tels que la compréhension et le raisonnement linguistique, les mathématiques et le codage. L’entreprise n’a pas hésité à afficher une comparaison entre Qwen, Llama et GPT4 lors de la présentation.

D’autres modèles dévoilés

Lors de sa conférence annuelle, Alibaba Cloud a également dévoilé un nouveau modèle texte-vidéo dans le cadre de sa famille de grands modèles d’image Tongyi Wanxiang. Il serait capable de générer des vidéos haute résolution dans une grande variété de styles visuels, allant de scènes réalistes à l’animation 3D. Le modèle peut générer des vidéos à partir d’instructions textuelles en chinois et en anglais, et transformer des images statiques en vidéos dynamiques. Il utilise une architecture avancée de transformateur de diffusion (DiT) pour améliorer la qualité de reconstruction vidéo.

Alibaba Cloud déploie également une mise à jour significative de son modèle Qwen2-VL pour la vision et le langage, capable de comprendre des vidéos de plus de 20 minutes et de répondre à des questions basées sur des vidéos. Doté de capacités sophistiquées de raisonnement et de prise de décision, Qwen2-VL est conçu pour être intégré dans des téléphones mobiles, des voitures et des robots, facilitant l’automatisation de certaines opérations.

Un assistant IA pour les développeurs

Pour la programmation informatique, Alibaba Cloud a également lancé un assistant IA pour développeurs, AI Developer, alimenté par Qwen. Cet assistant est conçu pour aider les programmeurs à automatiser des tâches telles que l’analyse des besoins, la programmation de code et l’identification et la correction des bugs logiciels, permettant ainsi aux développeurs de se concentrer sur des tâches plus essentielles et d’améliorer leurs compétences.

Retour en haut