La société française Linagora vient de dévoiler OpenRAG, une stack RAG (Retrieval-Augmented Generation) open source, modulaire, et conçue pour répondre aux besoins réels des entreprises : contrôle des données, scalabilité, interopérabilité. Présentation.
Là où les modèles de langage se multiplient et les données sensibles s’accumulent, OpenRAG fait le pari de la transparence. La stack repose sur des briques standard, sans dépendance à un fournisseur unique, tout en garantissant une compatibilité native avec les API d’OpenAI. On peut donc l’intégrer facilement à des interfaces comme OpenWebUI, à des chaînes LangChain ou à des pipelines n8n.
Le cœur du système, c’est une ingestion intelligente des documents. OpenRAG prend en charge un large éventail de formats — texte, PDF, audio, images — et les convertit tous en Markdown, avec génération automatique de légendes pour les contenus visuels. On peut ainsi créer une base de connaissances homogène, même à partir de fichiers hétérogènes. Le tout est accessible via une interface web pensée pour les équipes, avec gestion des partitions pour séparer les corpus par utilisateur ou service.
Côté architecture, OpenRAG repose sur Ray pour le déploiement distribué, avec des serveurs distincts pour chaque composant du pipeline : embedder, reranker, modèle de langage, analyse d’image. Résultat : une stack qui s’adapte à l’infrastructure de l’entreprise, du mono-GPU au cluster complet.
Mais ce qui distingue vraiment OpenRAG, c’est sa philosophie « privacy by design ». La séparation des données via Milvus et le cloisonnement fin de la récupération documentaire permettent aux organisations de déployer une IA générative sans compromis sur la sécurité ni sur la souveraineté. On est loin des solutions tout-en-un opaques des géants du cloud.
Le projet est entièrement libre, sous licence MIT, et disponible sur GitHub. Linagora (Ndlr: qui finance Goodtech.info) y voit un socle pour bâtir des assistants métiers internes, des chatbots documentaires ou des solutions de RAG verticalisées. Les prochaines versions promettent encore plus de formats, le support des agents, la gestion des appels d’outils, et un chiffrement natif des données.
OpenRAG se présente comme une alternative sérieuse et crédible aux stacks propriétaires.
