Capture d'écran de l'interface Red Hat AI Enterprise montrant un pipeline Data Science avec des étapes de fine-tuning et d'export de modèle

Red Hat AI Enterprise : une plateforme unifiée de l’infrastructure jusqu’aux agents IA

Nouveau cap dans sa stratégie IA de l’éditeur open source avec l’annonce Red Hat AI Enterprise, une plateforme intégrée conçue pour unifier le déploiement et la gestion de modèles, d’agents et d’applications IA dans les environnements cloud hybrides.

En parallèle, Red Hat présente Red Hat AI 3.3, qui introduit des mises à jour majeures sur l’ensemble du portefeuille IA de l’entreprise. Nous avions couvert la sortie de Red Hat AI 3 en octobre 2025.

Le constat de départ est familier : beaucoup d’organisations restent bloquées au stade du pilote IA, faute d’outils cohérents et d’infrastructure unifiée. Red Hat AI Enterprise entend résoudre ce problème en permettant aux équipes informatiques de gérer l’IA comme un système d’entreprise standardisé, aussi fiable et reproductible que des logiciels traditionnels.

Une pile « metal-to-agent » complète

Red Hat AI Enterprise s’appuie sur Red Hat OpenShift et Red Hat Enterprise Linux pour couvrir toute la chaîne : de l’infrastructure matérielle jusqu’aux agents autonomes. La plateforme intègre le moteur d’inférence vLLM et le framework d’inférence distribuée llm-d pour optimiser les déploiements de modèles d’IA générative dans les environnements hybrides. Elle fonctionne avec n’importe quel modèle, sur n’importe quel matériel. Pour les infrastructures NVIDIA, Red Hat et NVIDIA ont co-développé Red Hat AI Factory with NVIDIA, qui combine les capacités des deux plateformes enterprise.

Ce que Red Hat AI 3.3 apporte concrètement

La nouvelle version enrichit l’écosystème de modèles disponibles avec des versions compressées et validées de Mistral-Large-3, Nemotron-Nano et Apertus-8B-Instruct, accessibles via le catalogue OpenShift AI. DeepSeek-V3.2 avec Sparse Attention et Ministral 3 sont également supportés. Côté multimodal, la vitesse de Whisper est multipliée par trois.

Red Hat AI 3.3 introduit aussi une préversion technologique des modèles sous forme de service (Models-as-a-Service), permettant aux équipes informatiques de fournir un accès en libre-service aux modèles hébergés en interne via une passerelle API. Autre nouveauté notable : la prise en charge de l’inférence sur processeurs Intel pour les petits modèles de langage, avec certification étendue pour la technologie NVIDIA Blackwell Ultra et les accélérateurs AMD MI325X.

La gouvernance est également renforcée avec NeMo Guardrails intégrés (en préversion), une observabilité complète en temps réel sur les workloads IA, et un accès mutualisé aux GPU avec vérification automatique des points de contrôle pour éviter les pertes de travaux en cours d’entraînement.

Retour en haut