Vinod Mohan

Cinq caractéristiques à rechercher dans un système de fichiers distribués (DFS)

Qu’est-ce qu’un système de fichiers distribués ? Le rythme de croissance des données organisationnelles et l’ampleur de l’expansion des data centers modernes, surtout dans le cadre de l’architecture distribuée des systèmes informatiques d’aujourd’hui, obligent à se doter de systèmes plus centralisés de gestion du stockage des données, capables d’abattre les barrières que représentent une capacité de stockage cloisonnée et des structures de dépendance rigides.

Les utilisateurs et les applications d’aujourd’hui ont besoin d’accéder à tout moment et en tout lieu aux données, quel que soit le lieu de stockage. Cela est possible grâce à un système de fichiers distribués (DFS) basé sur une architecture client/serveur dans laquelle le stockage de données sur des systèmes de stockage distribués est géré sur un serveur centralisé et rendu accessible aux clients via des protocoles de partage de fichiers tels que NFS ou SMB. La technologie de virtualisation des fichiers intégrée à un DFS permet de créer une couche d’abstraction entre les serveurs de fichiers et les clients. Les équipes informatiques peuvent alors présenter aux clients un point de montage de fichiers logique pour tous les serveurs, tandis que les serveurs de fichiers continuent d’héberger toutes les données des fichiers. Le DFS joue un rôle essentiel, en particulier dans le monde des données non structurées, en fournissant une vue unifiée et logique des données dispersées sur des sites locaux et distants, y compris le cloud.

Architecture of a distributed file system (DFS)

Dans cet article, nous nous pencherons sur cinq caractéristiques clés d’un système de fichiers distribués qui vous aideront à savoir à quoi vous attendre si vous entreprenez d’en concevoir et d’en mettre un en œuvre pour votre organisation.

what is global namespace?N° 1 Transparence de l’emplacement

Par définition, dans le cas d’un outil informatique distribué, les appareils sont répartis sur un certain nombre de sites et d’emplacements. Une caractéristique primordiale à rechercher dans un DFS est la façon dont il regroupe différents espaces de noms depuis des serveurs de fichiers et des périphériques NAS distincts en un unique espace de noms global (voir la figure ci-dessus). Évitant à vos utilisateurs d’avoir se rappeler sur quel appareil est stocké tel fichier et de devoir le rechercher dans un espace de noms local, un DFS fournit un catalogue/répertoire global qui simplifie la recherche, la découverte et la consultation des fichiers dans votre environnement informatique distribué, cela depuis une interface unique.

Même lorsque vous déplacez des fichiers d’un appareil à l’autre, ils restent faciles à chercher et à trouver car ils sont disponibles depuis un plan de contrôle central, le DFS. Quel que soit l’emplacement où un fichier est déplacé, l’application ou l’utilisateur qui y accède peut le voir en toute transparence, sans nécessairement voir son emplacement physique lui-même. Pour cette application ou cet utilisateur, le fichier est récupéré depuis un référentiel de stockage central (virtuel) et aucune modification n’est apportée au chemin d’accès actuel du fichier ou à la hiérarchie habituelle des dossiers.

high availabilityN° 2 Haute disponibilité et redondance des données

Puisqu’un système de fichiers distribués est utilisé pour gérer l’accès à plusieurs systèmes de stockage, il est essentiel que ce système soit résilient afin que les données restent toujours disponibles. Une défaillance les rendrait inaccessibles et pourrait perturber le fonctionnement de l’entreprise. Il est donc important de le configurer avec une architecture haute disponibilité (HA) de sorte que si l’un des nœuds du DFS tombe en panne, un autre prend le relais et garantit l’accessibilité continue des données. Le DFS idéal pour votre environnement doit pouvoir être mis en place dans un cluster HA.

La mise en miroir synchrone et la réplication asynchrone sont deux techniques disponibles dans un DFS pour assurer la redondance et la récupération des données. Alors que la mise en miroir consiste à copier en temps réel toutes les données vers un deuxième système de stockage, la réplication asynchrone permet de créer des copies de fichiers, de volumes ou de partages spécifiques et de les déplacer automatiquement sur un site distant à des fins de récupération après sinistre.

actionable intelligenceN° 3 Mobilité des données fondée sur des règles

Un des aspects cruciaux du DFS est la possibilité de déplacer les données de manière transparente entre les différentes classes de stockage, en adaptant ce déplacement à la vitesse et au niveau de performances, au coût, au déploiement, au type de stockage, etc. Sachant que le DFS agit comme un centre de commande central chapeautant l’infrastructure de stockage de fichiers, les équipes informatiques peuvent l’utiliser pour régir le placement des données sur les différents supports de stockage.

Un cas d’utilisation type sera de placer les données les plus cruciales sur le NAS le plus rapide et de déplacer les données rarement consultées (ou inactives) vers le stockage local le moins coûteux ou le stockage pour données froides ou archives dans le cloud.

L’administrateur informatique peut également élaborer des stratégies personnalisées en fonction de l’âge du fichier, de son type, de sa taille ou encore des objectifs de performances, de durabilité, de protection ou de conformité. Il pourra ainsi déplacer les données vers des sites de stockage spécifiques.

Un DFS doit vous permettre de définir des classes de stockage et de fixer des règles de déplacement des données. Une fois paramétré, il doit être en mesure d’automatiser le placement des données sans aucune intervention manuelle et déterminer où chacune d’entre elle doit aller. Vérifiez que le DFS que vous souhaitez mettre en place intègre l’apprentissage automatique. Il pourra ainsi apprendre des modèles basés sur des critères personnalisés pour déplacer les données vers les destinations de stockage appropriées.

visibility and controlN° 4 Gestion fine au niveau des fichiers

Puisque les fichiers distribués sur divers appareils et systèmes de stockage sont régis de manière centralisée pour le placement, la mise en commun de la capacité de stockage, l’optimisation et l’équilibrage de la charge, il est également important de pouvoir bénéficier d’une gestion fine au niveau des fichiers, des volumes et des partages depuis le plan de contrôle DFS.

Voici quelques caractéristiques de gestion fine des fichiers qu’un DFS doit posséder :

  • Prise de snapshots d’un fichier, d’un volume ou d’un partage spécifique
  • Gestion de plusieurs copies d’ensembles de données spécifiques à des fins de récupération en cas de perturbation
  • Choix du site de stockage des fichiers en fonction d’objectifs d’entreprise personnalisés. Par exemple :
  • Déplacement des copies de snapshots vers le stockage d’un emplacement distant spécifique
  • Déplacement des fichiers vidéo (*.mp4) de plus de 500 Mo vers un serveur de fichiers Windows
  • Déplacement des données d’utilisateurs appartenant à l’équipe dirigeante sur un NAS NetApp rapide
  • Déplacement des fichiers d’un type spécifique vers un serveur sécurisé pour des raisons de conformité et de respect de la législation
  • Déplacement des fichiers non consultés au cours des 6 derniers mois vers un stockage S3 dans le cloud

ultimate flexibilityN° 5 Possibilité d’évoluer à la demande

Comme pour tout composant d’infrastructure informatique, l’évolutivité est l’une des exigences vitales d’un système de fichiers distribués. Compte tenu du rythme de croissance des fichiers et des niveaux de stockage de l’organisation, un DFS doit être capable de prendre en charge une grande diversité de systèmes de stockage avec plusieurs pétaoctets de capacité sur de nombreux emplacements et sites. Pour soutenir la croissance de la capacité et de la demande de débit, le DFS doit pouvoir évoluer horizontalement pour ajouter des nœuds indépendants à l’espace de nom global.

La flexibilité est également importante du point de vue de la mise à niveau ou du rafraîchissement du matériel de stockage sous-jacent. Choisissez un DFS qui vous permette d’exécuter des opérations de scale up et scale out de manière transparente et non perturbatrice, sans trop d’incidence sur les applications et les utilisateurs qui accèdent aux fichiers. Une telle flexibilité vous permettra également de vous libérer de l’emprise des fournisseurs et de remplacer à votre guise du matériel coûteux par des alternatives meilleur marché.

 

Une approche originale des systèmes de fichiers distribués par DataCore

Gardez à l’esprit ces cinq caractéristiques en recherchant la solution DFS la mieux adaptée à votre environnement. DataCore vFilO fait partie de ces systèmes de fichiers distribués qui sont software-defined par conception et qui reposent sur une technologie de virtualisation de fichiers en vue de vous permettre de contrôler de manière flexible et efficace la façon dont vous stockez, protégez et consultez les données. Avec vFilO, vous pouvez supprimer les dépendances hiérarchiques entre structures de fichiers et emplacements physiques, regrouper des espaces de noms fracturés en un point de montage virtuel global et faire entrer des archives distantes dans le domaine de la visibilité unifiée pour une recherche et un accès rapides. Vous pouvez prendre en charge la gestion de vos données en fonction des besoins de votre entreprise. Contactez-nous pour savoir comment résoudre vos problèmes de stockage de fichiers et d’objets distribués.

Get a Live Demo of SANsymphony

Talk with a solution advisor about how DataCore Software-Defined Storage can make your storage infrastructure modern, performant, and flexible.

Demander une Live Demo