Apache Iceberg : Cloudera renforce l’interopérabilité et la gouvernance des données ouvertes

Lors de son événement EVOLVE25 à New York, Cloudera a dévoilé deux nouveautés autour d’Apache Iceberg : un REST Catalog pour simplifier le partage de données et un Lakehouse Optimizer conçu pour améliorer les performances des tables. Deux annonces qui soulignent l’importance croissante de ce projet open source dans les architectures de données modernes.

Le format de tables Apache Iceberg s’impose de plus en plus comme standard pour bâtir des data lakehouses ouverts. Conçu pour gérer à grande échelle des données analytiques, il permet d’assurer la compatibilité entre différents moteurs, sans verrouillage technologique. Cloudera, qui en a fait le socle de sa plateforme, vient de franchir une nouvelle étape en annonçant l’intégration d’un Iceberg REST Catalog et le lancement d’un Lakehouse Optimizer.

Le premier permet aux entreprises de partager leurs données de façon « zéro-copie », en donnant accès aux métadonnées via une API REST. Concrètement, cela évite les transferts et duplications, tout en assurant une gouvernance centralisée et cohérente. Les données restent accessibles depuis différents moteurs – qu’il s’agisse de solutions analytiques, d’outils d’IA ou de services cloud – sans perte de contrôle ni de conformité.

Le second, baptisé Lakehouse Optimizer, propose une maintenance intelligente des tables Iceberg. En automatisant la réécriture de fichiers et l’optimisation des structures, il réduit les coûts de stockage tout en accélérant les requêtes. L’outil se veut ouvert et utilisable avec tout moteur compatible Iceberg, ce qui renforce la promesse d’interopérabilité chère à l’écosystème open source.

Avec ces annonces, Cloudera confirme son ambition de soutenir un modèle de gouvernance unifié et sécurisé autour de l’open source : Apache Iceberg apparaît ainsi plus que jamais comme l’une des briques essentielles d’une stratégie de données ouverte et pérenne.

Retour en haut