Cinq conseils pour la déduplication des données
Pourquoi la déduplication ? « La déduplication peut réduire jusqu’à 95% le volume des données pour les utilisateurs qui ont des habitudes de sauvegarde, telles qu’effectuer des sauvegardes quotidiennes durant la nuit, ou de sauvegarder des dizaines de machines virtuelles au sein de multiples serveurs hôtes, » affirment les experts d’Arkeia Software, éditeur international de solutions de sauvegarde des données. « Bien que la réduction de ratios soit très variable et dépende du type de données et fichiers sur le réseau, des réductions substantielles de temps, d’espaces et de coûts de sauvegarde peuvent être réalisées grâce à une stratégie de déduplication adaptée ».
Les cinq conseils ci-dessous permettent de choisir la technologie adaptée à une déduplication rapide, simple et aux moindres coûts :
1. Démarrer à la source
« Une déduplication à la source établit les bases d’une déduplication plus efficace. Elle détermine s’il existe déjà une copie d’un bloc spécifique de données sur le poste client. Typiquement, pour les environnements virtualisés qui ont de multiples copies du même système d’exploitation et des mêmes applications, la déduplication à la source empêche d’importants volumes de données redondantes dupliquées d’être transférés de disques sur bandes ou vers un espace de stockage dans le cloud. Même lorsque les sauvegardes se limitent au réseau local, la déduplication à la source permet des sauvegardes en réseau plus rapides grâce à des besoins en bande passante restreints, et supprime le traditionnel goulot d’étranglement qui limite les performances de sauvegarde en réseau local. »
2. Dédupliquer à la volée
Une déduplication peut être immédiate, alors que la sauvegarde est en cours, ou avoir lieu ultérieurement en mémoire cache ou lors d’une phase d’activation avant que les sauvegardes ne soient envoyées dans l’espace de stockage. La déduplication à la volée est préférable pour la sauvegarde des applications. De plus, la déduplication à la source doit être immédiate parce que la fenêtre de sauvegarde ne peut se terminer avant que les jeux de sauvegardes ne soient dédupliqués et transférés hors de la machine à sauvegarder.
3. S’interroger sur les blocs
Les technologies de déduplication se répartissent globalement en deux catégories – à base de blocs ou à base de fichiers. La déduplication à base de fichiers est rarement suffisante pour les entreprises en réseau qui ont souvent plusieurs versions d’un même fichier avec quelques différences minimes entre elles. La déduplication à blocs fixes est plus performante mais ne détecte pas les nombreux fichiers similaires. La déduplication à blocs variables atteint un coût d’administration élevé et/ou une puissance de traitement qui ralentit les sauvegardes.
La déduplication progressive fournit le meilleur des deux mondes : elle est rapide comme la déduplication à blocs fixes et offre une forte compression comme celle à blocs variables. La déduplication progressive ajuste la taille des blocs en fonction du type de données, telles que fichiers exécutables, fichiers textes ou bases de données, afin de produire la meilleure performance globale.
4. Accélérer la réplication
Lorsqu’il s’agit de répliquer des sauvegardes locales vers un cloud privé ou public ou au travers d’un réseau WAN, la déduplication offre des avantages substantiels de rapidité et d’efficacité. Dédupliquer les données sauvegardées avant de les répliquer ne réduit pas seulement le temps nécessaire au transfert des données au travers du réseau, mais diminue également le coût de bande passante et d’espace de stockage dans le cloud. Les anciens utilisateurs de bandes pour des sauvegardes hors site réaliseront que la déduplication permet désormais les transferts des données via un réseau WAN grâce aux réductions de temps et de coûts qu’elle apporte.
5. Choisir le tout-en-un
A présent, il n’y a généralement aucune raison de choisir un produit de déduplication indépendant qui s’ajoute à la solution de sauvegarde. Une approche tout-en-un n’est pas seulement plus économique, elle simplifie l’intégration et la configuration.
Les appliances de déduplication permettent de réduire les espaces de stockage, mais n’améliorent pas les temps de sauvegarde contrairement à la déduplication à la source. Les outils d’optimisation de réseau réduisent les besoins en bande passante des réseaux WAN mais pas ceux des sauvegardes. Ils n’offrent pas les avantages d’espace de stockage restreint à destination. Qu’un serveur de sauvegarde soit déployé sous forme d’appliance physique ou virtuelle, ou en tant que composante d’une offre logicielle de sauvegarde traditionnelle, un système unifié de protection des données et de déduplication réduit les coûts et accélère les sauvegardes.
Source: Arkeia