Non, le stockage sur bande n’est pas mort

Non, le stockage sur bande n’est pas mort

La bande est un media de stockage en place dans les entreprises depuis des dizaines d’années. Avec l’arrivée des services Cloud, et des nouvelles technologies de stockage sur disque (Tiering, SSD…), on aurait pu croire que la bande vivait ses derniers moments. Or c’est tout le contraire : le Cloud est l’avenir de la bande…

Rappelons ce qu’est la bande

La bande magnétique est un média qui sert traditionnellement à supporter les sauvegardes de nombreuses entreprises depuis des dizaines d’années. La bande a su évoluer avec le temps, et a gagné en rapidité, en capacité de stockage, en densité. Cependant, elle garde sa principale caractéristique : il faut la dérouler pour arriver à l’endroit où se trouve la donnée recherchée, contrairement aux disques durs, où c’est la tête de lecture qui se déplace en quelques millisecondes jusqu’au secteur de disque recherché. Dans les disques flash, il n’y a même plus de mécanique et l’accès à la bonne cellule de donnée est quasiment instantané.

Bande-Blog-photo1

Historiquement, la bande a fait ses débuts dans l’informatique dans les années 50. Le format a évolué et en 1990, IBM, HP et Seagate créent le format LTO[1], qui a la caractéristique principale d’être ouvert.

Commercialisé début 2000 avec le LTO-1, ce format s’est rapidement imposé comme un standard, et a pris la tête du marché des supports de sauvegarde.

Il n’a cessé d’évoluer depuis. Le tableau ci-dessous reprend les différentes déclinaisons au fil des ans :

Bande-Blog-photo3A ce jour, nous en sommes au LTO-6, mais la feuille de route du LTO est taillée jusqu’à la version 10, avec des capacités de 48 To par bande, à l’horizon 2020. Cependant, il est important de noter qu’IBM et Fujitsu on réussi récemment à placer l’équivalent de 220 To sur une bande. Ces capacités, qui correspondent à une version LTO-12, seraient disponibles vers 2025 à 2030. Elles offrent un rapport capacité / encombrement tout simplement extraordinaire.

Des inconvénients mais également des avantages

Du côté des inconvénients :

  • On pense généralement au premier inconvénient, qui est le fait que l’accès aux données sur bande est linéaire. Il faut donc dérouler la bande pour arriver à la donnée recherchée, ce qui induit un temps de latence largement incompatible avec de nombreux usages. Cet inconvénient majeur, réserve la bande à des fonctions de stockage ne nécessitant pas d’accès fréquent et rapide, et c’est toujours le cas avec la bande. C’est pourquoi ce média est principalement utilisé par les entreprises de nos jours à des fins de sauvegarde, ou de stockage à long terme.

Et c’est bien l’aspect principal du propos que nous souhaitons développer. Mais reprenons d’abord le fil de notre raisonnement.

  • Deuxième inconvénient de la bande : c’est un média amovible, et il faut donc gérer son cycle de vie, ses déplacements, son stockage, ses cycles de lecture / écriture, son contrôle, et son remplacement. Toutes ces opérations sont des processus qu’il faut modéliser, gérer, auxquels il faut allouer des ressources de gestion. C’était surtout vrai au début de l’utilisation de la bande, avant que les robotiques ne fassent leur apparition. Mais nous reviendrons plus tard sur les robotiques.

Du côté des avantages :

  • La bande est un media fiable. Solide, léger, difficilement altérable. Dans de bonnes conditions de conservation, on estime la durée de vie d’une bande à environ 30 ans, bien plus que la durée de vie d’un disque dur !
  • La bande est un media peu coûteux : comparé au disque dur, ou à des disques flash, elle offre un rapport coût / Go bien plus avantageux.
  • La bande ne consomme pas d’électricité quand elle n’est pas utilisée, cela se ressent particulièrement quand on gère ses bandes dans des bibliothèques hébergées dans des datacenters.
  • La bande a su évoluer avec le temps. Elle est devenue intelligente, et est par exemple capable de communiquer avec sa robotique, pour signaler un taux d’usure et initier ainsi un processus de recopie avant la perte de données.
  • La bande offre une densité beaucoup plus importante que les disques durs. Ainsi, dans un datacenter, vous stockerez bien plus de To ou de Po dans une surface donnée de m2, ce qui allège encore le coût du Go du fait d’un loyer amoindri par rapport à des baies de disque, gourmandes en électricité et en climatisation.

Le Cloud et la bande

Dans les années 1990 et 2000, les entreprises qui souhaitaient conserver leurs données à peu de frais, ou sur le long terme, devaient s’équiper en interne de toute une infrastructure pour gérer ces fonctionnalités : lecteurs de bande, robotiques pour les plus fortunées d’entre elles, afin de gérer leurs bandes en mode mutualisé. Mais les robotiques coûtaient cher, aussi bien à l’achat qu’en maintenance, et les processus de gestion de bande étaient lourds et demandaient de la main d’oeuvre. Sans compter les innombrables aller / retours aux coffres ignifugés, voire sur des sites délocalisés, pour se plier à des contraintes de séparation géographique des données.

Avec l’arrivée des services Cloud, de nouvelles opportunités s’ouvrent en termes de gestion des sauvegarde, et de conservation long terme.

Pour faire simple, le Cloud va permettre de délocaliser la fonction de sauvegarde sur bande, chez un prestataire, qui prendra en charge le service de A à Z, depuis la gestion des robotiques, jusqu’à la conservation des bandes, en passant par la maintenance, les opérations de contrôle et de recopie, la duplication, triplication…

Le service informatique interne est ainsi déchargé d’une gestion bien trop lourde et coûteuse, et a à disposition un stockage de forte capacité, à très bas prix, qu’il paye en fonction de la quantité de données qu’il souhaite y sauvegarder.

De plus, les services de stockage Cloud s’intègrent particulièrement bien dans les PCA[2] / PRA des entreprises, puisqu’ils offrent cette délocalisation géographique que nombre d’entreprises ne pouvaient s’offrir auparavant, gérant leur stockage en interne.

La différence majeure avec le stockage sur disque, est que le prix au Go est divisé par 3 ou 4, voire plus selon les prestataires.

Cette différence de prix est bien sûr due aux caractéristiques énoncées précédemment, à savoir :

  • Prix d’achat du media plus faible qu’un disque dur ou flash (prix au Go)
  • Pour le prestataire, densité plus importante synonyme de moins de loyer de datacenter
  • Pour le prestataire, media inerte quand non utilisé, d’où une consommation d’électricité moindre.

La bande a évolué, mais les robotiques également. Nous sommes passés de machines Bande-Blog-photo5complexes, avec des bras articulés qui allaient chercher les bandes dans leur silo pour les amener aux lecteurs, à des lecteurs mobiles qui se déplacent sur des rails jusqu’à la bande en question. Les bibliothèques de bande sont maintenant des machines compactes, qui peuvent contenir jusqu’à 10.000 cassettes, et qui peuvent être chaînées les unes aux autres pour offrir des capacités de stockages se déclinant in fine en centaines de Pétabytes, voire en Exabytes[3] si l’on a recours à des cassettes de type T10000 C ou D.

Des fonctions intelligentes ont été implémentées dans ces machines. Par exemple, quand les lecteurs sont inoccupés, ils peuvent être employés à vérifier la qualité des bandes, et à recopier celles pour lesquelles un taux d’usure important est détecté.

Pour conclure

Le plus étonnant dans tout cela, est que seuls quelques acteurs majeurs du Cloud ont saisi le caractère stratégique de la sauvegarde sur bande. Dans la majorité des esprits, bande est synonyme de vieillot, de lenteur et est donc de facto exclu de toute réflexion stratégique. Il est vrai que de nombreuses sociétés mettent en avant les nouvelles technologies autour des mémoires flash, ou des disques durs ultra-rapides.

Il est indéniable que la bande n’a pas les mêmes usages que les disques ou mémoires flash, réservés à des systèmes on-line nécessitant des temps de réponse très rapides ou capables de supporter des IOPS très élevés. Elle répond toutefois à un certain nombre de besoins.

Si vous avez besoin :

  • de stocker des données que l’on appelle « froides », c’est à dire des données qui sont peu consultées,
  • de stocker des énormes volumes de données avec un budget restreint,
  • de stocker des données sur 5, 10, 15, 20 ans pour des raisons réglementaires comme de l’archivage légal par exemple,
  • de stocker des données en 2, 3 copies sur des sites distants pour un PCA ou un PRA,
  • de rationaliser votre informatique interne et d’externaliser ce type de service déjà en place depuis des années au sein de votre DSI…

…alors pensez à la bande.

C’est sans doute la solution à laquelle peu de gens pensent, mais qui répond à tous ces critères.

En France, très peu de prestataires offrent ce stockage sur bande, mais en cherchant bien vous en trouverez. C’est un marché émergeant.

Dans le monde, quelques « petits » acteurs ont recours à la bande depuis des années :

En interne, Google utilise des bibliothèques de bande pour sauvegarder son service de mail Gmail. La bande a d’ailleurs été l’ultime média qui lui a permis de restaurer ses données lors de la monstrueuse panne du service Gmail en février 2011.

En effet, lors de la corruption du système de messagerie Gmail en février 2011, les ingénieurs ont eu recours aux sauvegardes sur disque dans un premier temps. Or il s’est avéré que celles-ci étaient inopérantes, car les données corrompues sur la production, avaient été sauvegardées en cascade -mais toujours corrompues- sur les différents niveaux de sauvegarde disque. Les bandes -sur lesquelles Google avait également eu la bonne idée de sauvegarder les données comme ultime recours -étant hors-ligne, n’avaient pas été affectées par la corruption, et ont permis de restaurer le système.

Et après ? 

La prochaine étape sera d’offrir en plus d’un service de stockage sur bande, et d’un service de stockage sur disque, un système de gestion permettant de passer les données de l’un à l’autre en fonction de règles de gestion simples comme la date de dernier accès aux fichiers.

L’intérêt est évident, étant donné que les 2 supports ne présentent pas les mêmes coûts : rationaliser les coûts de stockage de données de façon automatique, en fonction de leur fréquence d’accès. Les données « chaudes” sur disque, les données « froides » sur bande, sachant qu’une donnée peut passer de froid à chaud et inversement, tout en restant stockée sur le média approprié…

Le principe existe depuis longtemps, cela s’appelle un HSM[4], mais on ne le trouve encore quasiment jamais chez les prestataires Cloud, où disques et bandes (quand il y en a) sont adressés par le client via deux canaux de communication différents.

Mais ceci est une autre histoire et fera l’objet d’un nouvel article dans quelques temps.

[1] LTO : Linear Tape Open

[2] PCA/ PRA : Plan de reprise d’activité / plan de Continuité d’activité

[3] 1 Po = 1024 To. 1 EB = 1024 Po

[4] HSM = Hierarchical Storage Management

——

L’auteur
Directeur au sein de Beamap, Vincent Baudet est en charge du Delivery des missions Beamap. Avec 20 ans d’expérience dans le conseil IT, Vincent a mené de gros projets d’intégration pour de clients internationaux. Il est également aguerri sur les phases d’avant-projet, de type Business case, schémas directeur, études de choix. Au sein de l’écosystème Cloud, ses compétences sont plus particulièrement tournées ver les plans de transformation, et les technologies de stockage.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :