Comment Groq et IBM veulent améliorer la technologie open source vLLM de Red Hat

Groq — à ne pas confondre avec Grok, le chatbot d’Elon Musk — s’allie à IBM pour renforcer la prochaine génération d’IA open source. L’entreprise californienne, connue pour ses processeurs spécialisés dans l’inférence à très basse latence, collabore désormais avec IBM et Red Hat pour améliorer vLLM, le moteur open source d’inférence rapide de modèles de langage.

Selon l’annonce officielle, ce partenariat vise à accélérer le déploiement de l’IA en entreprise en combinant la technologie d’inférence de Groq, GroqCloud, avec la plateforme watsonx Orchestrate d’IBM. L’objectif : rendre l’IA agentique — ces systèmes capables d’agir et de raisonner en autonomie — plus rapide, plus fiable et plus accessible dans les environnements de production.

Une architecture dédiée à l’inférence open source

IBM et Groq annoncent qu’ils vont intégrer l’architecture LPU (Language Processing Unit) de Groq à vLLM, une technologie open source développée par Red Hat pour optimiser l’exécution des modèles de langage à grande échelle. Cette intégration permettra d’accélérer les traitements, tout en maintenant la compatibilité avec les outils existants de la suite Red Hat et watsonx.

En pratique, GroqCloud promet une inférence jusqu’à cinq fois plus rapide que les systèmes GPU traditionnels, avec une latence quasi nulle et une meilleure efficacité énergétique. Une caractéristique essentielle pour les environnements critiques — santé, finance ou services publics — où les flux de requêtes doivent être analysés et traités instantanément.

Rob Thomas, vice-président senior chez IBM, résume ainsi l’enjeu :

« Beaucoup d’entreprises testent des modèles d’IA sans parvenir à les faire passer en production. Notre partenariat avec Groq vise à lever ces verrous et à rendre l’IA vraiment opérationnelle à grande échelle. »

L’intégration de GroqCloud à watsonx Orchestrate permettra aux entreprises d’orchestrer des flux de travail complexes à partir de modèles open source, tout en bénéficiant d’une inférence accélérée, sécurisée et automatisée. IBM rendra également ses modèles Granite accessibles via la plateforme de Groq, renforçant ainsi l’interopérabilité entre les écosystèmes IBM et open source.

Retour en haut