Le blog qui parle des technologies de demain...DF.I

Quand les technologies de stockage du Web reviennent dans l’entreprise …

Les GAFA rencontrent souvent les mêmes problèmes que toutes les entreprises … mais plus vite.

S’il est un secteur de l’infrastructure où les géants du Web ont fait progresser les technologies, c’est bien celui du stockage : photos, vidéos, journaux de connexion et de navigation.

Ils ont rapidement dû repousser les limites des architectures traditionnelles pour répondre aux besoins de leur marché :

  • Croissance des données exponentielles,
  • Nécessité de stocker la donnée à long terme et de manière sécurisée – à titre légal, règlementaire ou simplement pour satisfaire leur clients,
  • Accès à la donnée en mobilité et de manière distribuée à l’échelle mondiale,
  • Possibilité d’analyser les données, actuelles et historiques.

Chaque DSI trouvera ici des problématiques qui lui sont régulièrement posées et auxquelles il se doit de trouver une réponse à coût serré…

Une conception complexe pour un stockage simplifié

La réponse à ces questions se trouve dans cinq propriétés d’un système de stockage évolué :

  • son accessibilité au travers d’interfaces orientées Web et mobilité,
  • son évolutivité (en performance comme en capacité) sans interruption de service,
  • sa sécurité au travers du chiffrement de chaque segment de donnée et un système de contrôle d’accès complet,
  • sa disponibilité quel que soient les opérations effectuées (évolutions logicielles ou changement de matériels),
  • sa facilité de gestion grâce à l’absence de grappes RAID ou de réplication et la fourniture d’APIs de gestion, réduisant ainsi la charge d’exploitation,
  • son efficience : plus on augmente le stockage utile, plus on améliore le ratio stockage utile vs. stockage brut, améliorant ainsi consommation électrique, empreinte au sol, etc…

Au cœur du système, algorithmes et intégrité

Au cœur du système, il y a des algorithmes. Tout d’abord, un algoritme dit d’erasure coding protège la donnée en transformant une donnée de n segments en n+p segments dont on peut perdre p segments et quand même retrouver la donnée.

Ensuite un autre algorithme, assure le positionnement de ces segments sur un ensemble de nœuds formant le cluster de stockage-objet. Par un positionnement intelligent de ces segments (par disque, par nœuds, par rack et par site), on sait se garantir de différents niveaux de pannes.

En intégrant directement dans la solution des processus de contrôle de l’intégrité de la donnée à l’écriture comme à la lecture, des processus d’arrière-plan de vérification et de correction des erreurs, le stockage objet devient la plateforme de stockage présentant la garantie de protection des données la plus forte autorisant statistiquement la perte d’un bit sur plusieurs centaines d’années là où un système traditionnel peine à offrir la même garantie sur quelques années.

Une conception nativement distribuée

On retrouvera dans toutes les offres une conception assez similaire s’organisant autour de 3 composants : un composant de gestion permettant la configuration et parfois le déploiement de tout le système ; une couche d’accès offrant les protocoles et APIs aux consommateurs du stockage et enfin la couche de stockage proprement dit. Ces couches d’accès et de stockage sont extensibles quasiment à l’infini.

IBM Cloud Object Storage

Parlons un peu de l’offre d’IBM Cloud Object Storage, reconnue comme leader par IDC dans son MarketScape de décembre 2016.

IBM Cloud Object Storage est une solution de stockage-objet mature basée sur la technologie Cleversafe, société fondée en 2004, dépositaire de plus de deux cents brevets à la date du rachat en novembre 2015 par IBM. De multiples clients de la solution ont ainsi plus de 100 pétaoctets déployés en production dont certains approchent même l’exaoctet.

Un déploiement flexible

IBM Cloud Object Storage propose un vaste choix de modèles de déploiement, on-premises (sous forme logicielle ou d’appliance), en cloud hybride et off-premises (cloud) avec un rapport coût/performances inégalé, la portabilité de la licence et enfin des outils et des fonctionnalités homogènes on-cloud et on-premises.

Indépendamment du mode de déploiement, IBM Cloud Object Storage propose une large gamme de connectivité réseau, des API pour S3, Swift et le support de NFS pour l’accès aux objets.

La sécurité au cœur du système

Le chiffrement d’IBM Cloud Object Storage, « SecureSlice ZeroTouch », est intégré au cœur même du système avec une gestion des clés embarquée. Le chiffrement fournit une sécurité de haut niveau, pour les données sur les disques comme pour les données en mouvement.

Par conception, aucun disque, nœud ou site ne contient suffisamment d’informations pour permettre une violation de données.

Une donnée toujours disponible

Avec IBM Cloud Object Storage, l’accès à la donnée se fait sans interruption au cours des mises à jour logicielles, des actualisations de matériel, face aux défaillances de site, de nœud ou de disque. IBM Cloud Object Storage permet également l’intégrité des données avec des possibilités de pertes de données quasi-nulles même sur une échelle de temps très longue, via Erasure Coding et IDA (Information Dispersal Algorithm).

Pour quels besoins dans l’entreprise ?

Le stockage-objet n’a pas pour cible la performance d’entrée/sortie nécessaire pour une base de données ou un tampon de calcul haute performance dont la fréquence de changement de chaque bloc de donnée est importante.

Sa destination est orientée nettement soit vers l’accès concurrent en lecture de milliers d’utilisateurs à des millions de fichiers de toutes tailles, soit vers des accès séquentiels massifs, de fichiers vidéo, de containers de sauvegarde, etc…

Archives actives

Les archives actives correspondent au positionnement historique du stockage-objet : à l’origine, on parle de données dont les besoins de rétention et de préservation s’étalent sur des durées longues, imposées souvent par des impératifs légaux (courriels, fichiers, dossiers individuels, …). Dans ce cadre, les besoins d’accès aux fichiers, une fois archivé, sont relativement faible, et l’activité de l’archive négligeable.

Peu à peu, ce besoin s’est étendu à toute la société de la recherche géologique et à la conquête spatiale, des dossiers patients au séquençage du génome, des fichiers audio et vidéo des spécialistes des médias à la vidéosurveillance de nos entreprises, villes et transports. Avec l’augmentation des capacités de traitement, celles qui n’étaient que des archives de conservation sont devenus des archives consultées et traitées régulièrement : actives.

Partage de fichiers d’entreprise

Le manque de souplesse des partages de fichiers traditionnels (NAS) ont rapidement poussé les utilisateurs à rechercher des solutions de stockage de fichiers (bureautiques ou autres) accessibles partout en mobilité et dont les permissions de partages peuvent être définies de manière simple.

Portail collaboratif de l’entreprise ou stockage en ligne (Dropbox, Box et autres Sharefile …), ils s’appuient ou peuvent s’appuyer directement sur un stockage-objet.

Données de sauvegarde

Les entreprises cherchent tout naturellement à abandonner les stockages coûteux pour déposer leur sauvegarde. Si cela n’est pas toujours possible pour le premier tiers du dépôt de sauvegarde nécessitant des performances importantes, introduire un stockage-objet en second tiers améliore clairement le TCO de la solution de sauvegarde et bénéficie de ses propriétés de durabilité.

La plupart des produits de sauvegarde du marché (CommVault, Veritas, IBM …) peuvent nativement bénéficier des object store comme cible de stockage ; pour les autres, des passerelles sont disponibles.

Et pour votre entreprise ?

Il serait absurde de présenter – aujourd’hui – le stockage-objet comme la panacée universelle à toutes les surcharges de données des entreprises : le positionnement en volume est élevé et il est vain de rechercher un ROI à moins de 500 ou 700 To utiles en comparaison de solutions de stockage plus traditionnelles.

Par contre, sur un positionnement à grands volumes, il prendra toute sa valeur dans une protection multi-site à minimum 3 sites : on observe alors des réductions jusqu’à 70% du TCO en comparaison de solutions traditionnelles.

Naturellement, ces volumes restent importants pour la plupart des entreprises, à l’exception peut-être du poste sauvegarde et archivage, grand consommateur de stockage. En démarrant par une cible de sauvegarde sécurisée sur 3 sites, en remplacement du stockage traditionnel ou d’appliances de déduplication, on trouvera dans le stockage-objet un bon intermédiaire entre le stockage disque traditionnel et la bande, avec une pérennité des données quasi-inégalée.

Laisser un commentaire

Consulter la charte de modération