Avec CUDA 13.0, Nvidia veut unifier le calcul GPU sur x86 et Arm

La version 13.0 de la boîte à outils CUDA marque une étape stratégique pour Nvidia. En apportant un support unifié des architectures x86 et Arm, cette mise à jour, annoncée début août, pourrait bien transformer le paysage du calcul haute performance, en particulier dans les domaines de l’IA et du traitement de données en périphérie.

Disponible dès à présent sur le site officiel de Nvidia, CUDA 13.0 a été lancé en parallèle du pilote Linux R580 en version bêta. Celui-ci pose les bases d’un support à long terme (jusqu’en 2028) et d’un meilleur couplage entre le matériel GPU Nvidia et son écosystème logiciel. L’enjeu : faciliter l’écriture d’un même code optimisé pour différentes architectures CPU.

Unification x86/Arm : vers un CUDA vraiment portable

Le principal changement apporté par CUDA 13.0 est l’unification du support des plateformes x86 et Arm, permettant aux développeurs de déployer un même code GPU sur les deux types de processeurs, sans avoir à reconfigurer ou adapter manuellement leurs projets. Une avancée qui simplifie considérablement le développement d’applications pour centres de données hybrides, clusters edge computing ou objets connectés de nouvelle génération.

Comme l’explique Phoronix, cette compatibilité croisée résout une difficulté historique dans l’écosystème CUDA : la fragmentation entre plateformes CPU. Désormais, les développeurs peuvent compiler du code compatible Arm64 sans sacrifice de performance ni perte de fonctionnalités.

Un nouveau compilateur plus strict, mais plus sûr

Selon les notes de sortie, CUDA 13.0 introduit aussi d’importants changements au compilateur CUDA C++ (NVCC), notamment une gestion affinée de la visibilité ELF et des liaisons entre fonctions globales et variables de périphérique. Si ces modifications peuvent impacter certains projets existants, elles renforcent la stabilité à l’exécution et facilitent le débogage dans les environnements complexes.

Des ajustements ont également été opérés au niveau de la gestion mémoire et du modèle de programmation, en particulier pour les workflows orientés data science ou machine learning. Les outils de la suite RAPIDS bénéficient par exemple de nouvelles optimisations pour accélérer l’analyse de données via GPU.

Fin de support pour les anciens GPU

Cette version tourne résolument la page des architectures GPU plus anciennes. Le support de la compilation hors ligne est abandonné pour les architectures inférieures à la capacité de calcul 7.5 — ce qui exclut les générations Maxwell, Pascal et une partie des Volta. Pour ces cartes, les développeurs devront se contenter de CUDA 12.9 couplé au pilote R580.

En contrepartie, CUDA 13.0 est pleinement optimisé pour la nouvelle architecture Blackwell, et laisse entrevoir une ouverture future à d’autres architectures émergentes comme RISC-V. Nvidia continue donc d’ajuster son écosystème à l’évolution rapide des paradigmes matériels.

Et pour Linux ?

Comme toujours, Linux reste la plateforme de référence pour CUDA. Le pilote R580 introduit avec cette version 13 est spécifiquement pensé pour proposer une base stable, notamment dans les environnements Ubuntu et CentOS utilisés dans les centres de données et clusters de recherche. Les utilisateurs Linux peuvent dès à présent tester le nouveau runtime, mais devront prendre en compte les nouvelles exigences matérielles et logicielles introduites par cette mise à jour.

Retour en haut