Entête Menu Outils Article Pied de page

Outils

Éligibilité
ADSL - SDSL

Whois

Test DNS

Stockage

< Publications | Systèmes

Un article des techniciens de Céleste.

Sommaire

Le stockage de données informatiques

Introduction

Que ce soit à la maison ou au bureau, l'informatique occupe une place de plus en plus importante, produisant une masse de données en croissance constante. Le choix du support de stockage de ces données doit se faire en fonction de différents paramètres, comme le volume, la fréquence d'utilisation ou encore la durée minimale pendant laquelle ces données doivent être disponibles.

Dans cet article, nous allons aborder quelques notions de base sur le stockage des données informatiques, comme le codage et la compression des informations. Nous nous intéresserons ensuite aux différents supports disponibles avant de voir comment protéger efficacement ses données, afin que vous soyez à même de choisir les solutions les mieux adaptées à votre cas.

Notions élementaires

En informatique, toutes les informations sont codées en binaire, c'est à dire sur 2 états que l'on représente par 0 et 1 (dans la pratique le 1 peut être une tension de 5V et le 0 une tension de 0V). Un 1 ou un 0 est appelé bit, tandis qu'un groupe de 8 bits est appelé octet (ou byte en anglais). Un octet peut donc prendre 2^8 soit 256 valeurs. Un Ko (kilo octet) est défini comme une groupe de 2^10=1024 octets, le Mo (mega otctet) vaut 1024Ko, le Go (giga octet) vaut 1024Mo, le To (tera octet) vaut 1024Go, le Po (peta octet) vaut 1024To, etc.

Un exemple avec le stockage du texte : on va utiliser un codage faisant correspondre une succession de 1 et de 0 à un caractère. Le codage le plus connu est sans doute l'ASCII (American Standard Code for Information Interchange). Créé en 1961, ce code définit 127 caractères codés sur 7 bits et permet d'écrire un texte en anglais. Le 'a' par exemple est représenté par 1100001, mais les ordinateurs travaillant par groupe de 8bits, un 8ème bit toujours à 0 y a été ajouté ce qui donne 01100001. Cependant, les caractères accentués ou encore les alphabets grecs, russes, japonais, etc. ne sont pas pris en compte, et c'est pourquoi il existe aujourd'hui presqu'autant de codages que de langues. Pour écrire du texte en français, on choisira par exemple le codage ISO-8859-1 ou ISO-8859-15 (sur 8 bits) progressivement remplacés par l'UTF-8 sensé unifier les différents codes.

Prenons un autre exemple, le stockage d'images. Une image peut être représentée par une grille de x colonnes par y lignes dont chaque case (1 pixel) se voit attribuer une couleur (on parle alors d'une image de résolution x par y pixels). Un écran standard de 17 pouces peut afficher 1280x1024 pixels, chacun de ces pixels étant constitué d'un mélange de 3 couleurs (rouge vert et bleu) permettant de reproduire l'ensemble des couleurs visibles. On peut donc décrire un pixel par 3 octets définissant l'intensité de chacune des couleurs primaires, soit plus de 16 millions de couleurs (2563). Une image de 640x480 pixels occupera donc 640x480x3=921600 octets (900Ko).

Vous vous dîtes surement que vous avez des photos de vacances en bien meilleure résolution et qui occupent moins d'espace sur votre disque. En effet, les techniques de compression permettent de réduire la taille de l'image, avec ou sans perte d'information, on parle alors de compression destructive ou conservatrice. Le type de compression le plus simple est le RLE (RunLength Encoding) : une succession d'octets identiques est remplacée par un couple nombre d'occurences/octet répété, cette technique est conservatrice. Dans le même esprit, des formats d'images comme le jpg définissent des zones de couleur identique avec plus ou moins de tolérance et décrivent donc des couples régions/couleurs. Le jpg est par contre une méthode de compression destructive, puisque l'on va gagner de l'espace au détriment des nuances de couleurs.

Les supports

Afin de stocker ces successions de 1 et de 0, différents supports existent, que l'on peut regrouper en 4 grandes familles : les supports physiques, magnétiques, optiques et à mémoire flash. Nous allons ici passer en revue ces familles, avec leurs avantages et leurs inconvénients.

Supports physiques

Abandonné depuis le début des années 80, ce type de support à été le premier type de mémoire de masse utilisé en informatique. Les données étaient enregistrées sur des bandes ou cartes perforées, un trou représentant un 1 et pas de trou un 0. Malgré sa simplicité, ce type de support présentait de nombreux inconvénients : les cartes devaient être lues dans l'ordre où elles avaient été écrites, la modification de données sur les bandes perforées (palliant le problème de l'ordre des cartes) n'était pas aisée. De plus la relative faible densité d'information et la fragilité de ce type de support a rapidement conduit à trouver de nouvelles solutions.

Supports magnétiques

Sans doute le type de support de stockage de masse le plus utilisé aujourd'hui, les 1 et 0 sont stockés sous forme de champ magnétique. Parmi cette famille de supports on retrouve la cassette (comme les cassettes audio) qui ont été utilisées quelques temps dans les années 80, les disquettes qui ont remplacées les cassettes (jusqu'au début des années 2000), la bande magnétique qui est toujours utilisée comme support d'archivage ou le disque dur présent dans la plupart des ordinateurs actuels. Ces supports présentent aujourd'hui le meilleur rapport capacité/prix. Les bandes magnétiques ont cependant des temps d'accès élevés et des débits relativement faibles ce qui les réserve à un usage peu fréquent (archivage). Les disques durs offrent quand à eux de bien meilleures caractéristiques et en font le support privilégié pour une utilisation quotidienne, malgré une relative fragilité.

Supports optiques

Très largement utilisés pour diffuser de la musique ou des films, ce type de support stocke les informations sous forme de reliefs détectés par un rayon laser (un creux=0, une bosse=1). Les CD, les DVD et maintenant les Blu-Ray font partie de cette famille, la différence entre ces 3 technologies se faisant au niveau de la couleur du rayon laser utilisée, directemement liée à la taille du faisceau impactant la densité d'informations. Un CD utilise un laser rouge (le plus large), un DVD un laser orange et enfin un Blu-Ray un laser bleu (le plus fin). Il faut cependant bien faire la différence entre les disques pressés (non enregistrables) et les disques gravés (enregistrables, mais bien plus fragiles). Le premier type de disque créé à partir d'un moule, est utilisé dans l'industrie de la musique, du cinéma ou du logiciel pour la diffusion à grande échelle, tandis que le second permet d'écrire des données depuis un graveur mais sa durée de vie est bien plus courte...

Supports à mémoire flash

Derniers nés des types de supports de stockage, ils utilisent des semi-conducteurs (notamment des transistors MOS) pour stocker les 1 et les 0. Si le transistor bloque le courant, un 1 est enregistré, si au contraire il le laisse passer, c'est un 0 qui est stocké. Ce type de mémoire se retrouve notamment dans la RAM des ordinateurs, les clefs USB, les cartes mémoires (CF, SD, MMC, MS...) et plus récemment dans les SSD (disques durs à mémoire flash). Ses avantages sont une consommation électrique faible (quasi nulle au repos), des temps d'accès courts, un débit élevé, ou encore une grande résistance aux chocs (pas de parties mécaniques), ce qui en a fait le support de prédilection des baladeurs numériques, et maintenant des netbooks. Le prix de ce type de mémoire reste cependant encore relativement élevé, notamment par rapport aux supports magnétiques, et leur durée de vie est encore limitée, chaque écriture abimant un peu plus les composants.

Type Capacité Prix/Go Caractéristiques Durée de rétention

Bande

Magnétique

400Go

0.1€

temps d'accès variables (jusqu'à plusieurs secondes/minutes), débit jusqu'à 25Mo/s, support amovible

10 à 20 ans

Disque Dur

Magnétique

750Go

0.12€

temps d'accès de quelques millisecondes, débit jusqu'à 100Mo/s en lecture, 60Mo/s en écriture

quelques années

CD

Optique

700Mo

1.25€

temps d'accès de quelques millisecondes, débits jusqu'à 15Mo/s en lecture, 10Mo/s en écriture, support amovible

quelques années

DVD

Optique

4.7Go

0.5€

temps d'accès de quelques millisecondes, débits jusqu'à 25Mo/s en lecture, 20Mo/s en écriture, support amovible.

quelques années

BluRay

Optique

25Go

0.25€

temps d'accès de quelques millisecondes, débits jusqu'à 25Mo/s en lecture, 20Mo/s en écriture, support amovible

quelques années

Clef USB

Flash

16Go

2.4€

temps d'accès très faibles, débits jusqu'à 35Mo/s en lecture, 15Mo/s en écriture

quelques dizaines d'années

SSD

Flash

64Go

10€

temps d'accès très faibles, débits jusqu'à 200Mo/s en lecture, 80Mo/s en écriture, support amovible

quelques dizaines d'années

Protéger ses données

Que ce soit pour un particulier ou un professionnel, la protection des données informatiques ne devrait pas être ignorée, l'un ou l'autre ayant des documents "précieux" sur leurs ordinateurs (photos, mails.. pour les premiers, documents texte, tableurs... pour les seconds). Après quelques définitions, nous allons aborder les différents risques que courent vos données, et les moyens d'y pallier.

Définitions

Pour mettre en place du RAID sur un ordinateur, on a le choix entre le RAID matériel et le RAID logiciel. Dans le premier cas, on utilise une carte contrôleur dédiée à laquelle sont rattachés les disques, et c'est la carte qui va s'occuper de la répartition des données sur les disques ainsi que des calculs de parité. Dans le deuxième cas, les disques sont directement rattachés à la carte mère, et c'est le processeur principal qui va réaliser les opérations de répartition des données et les calculs de parité.

Les risques et leurs parades

Le premier risque auquel on peut penser est la défaillance matérielle. Les disques durs font parties des pièces les plus fragiles constituant un ordinateur, mais d'autres éléments peuvent tomber en panne comme l'alimentation, le processeur ou la RAM... Dans un premier temps on peut essayer d'éviter ces pannes, par exemple en ondulant l'alimentation de la machine, les variations de potentiel pouvant endommager la plupart des composants... Ensuite, la meilleure parade dans ces cas est d'avoir redondé les composants sensibles : utiliser du RAID (1 ou 5) pour les disques durs, une double alimentation, voire un double processeur...

Dans le cas où des données ont été perdues, soit à cause d'une erreur humaine soit à cause d'un problème matériel (ex: coupure d'électricité lors d'écritures sur le disque), le moyen le plus sûr de récupérer (une partie) des données est de repartir de la dernière sauvegarde effectuée, en espérant qu'elle ne soit pas trop ancienne. Il existe aussi des outils permettant de restaurer des fichiers supprimés sur différents systèmes de fichiers, mais à utiliser vraiment en dernier recours, les fichiers à restaurer n'étant pas forcément faciles à retrouver, et les données récupérées pouvant n'être que des fragments de fichiers finalement inexploitables...

Finalement, en cas de sinistre dans vos locaux, si vos équipements informatiques ne sont plus exploitables, ce sont les sauvegardes externalisées qui vont permettre une reprise d'activité une fois le matériel restauré/remplacé. Les sauvegardes externalisées sont des sauvegardes qui ne sont pas stockées sur le même site géographique. On a deux solutions pour externaliser les données : les stocker sur des supports amovibles (CD, DVD, Bande...) et amener ce support sur le 2ème site, soit utiliser le réseau pour transférer les données sur un serveur de stockage distant, cette dernière solution étant bien plus souple mais nécessitant un bon débit ascendant pour pouvoir effectuer des envois en un temps acceptable sans monopoliser la bande passante.

Conclusion

Nous avons vu qu'il existe de nombreux supports de stockage aux caractéristiques différentes. Le choix du bon support doit donc se faire en fonction de différents paramètres comme la capacité, le coût, les besoins de performance ou non... Le disque dur magnétique reste cependant la valeur sûre du stockage de masse pour une utilisation quotidienne, de par son rapport (capacité + performance)/prix mais également de par sa souplesse d'utilisation (écriture, réécriture, effacement...). Les disques SSD bien qu'encore peu répandus, sans doute à cause de leur prix bien plus élevé, pourraient cependant venir remplacer prochianement les disques durs de nos ordinateurs personnels.

Les médias optiques bien que moins simples d'utilisation que les disques durs par exemple (utilisation d'un logiciel de gravure), bénéficient encore d'une image de fiabilité à plus ou moins juste titre et devraient encore avoir de beaux jours devant eux. Leur prix relativement faible (supports vierges et graveur) en font une solution de choix pour l'archivage à petit budget, notamment pour les particuliers. Ce type de support reste également le média le plus utilisé pour la diffusion et la distribution de musique , de films ou encore de logiciels...

En ce qui concerne la protection des données, nous avons vu qu'il existait différents risques dont les méthodes de prévention ne sont pas les mêmes, l'idéal étant de pouvoir cumuler les différentes mesures préventives afin de pallier un maximum de problèmes éventuels. Terminons donc par deux exemples, chez un particulier et une entreprise, où les préoccupations et les moyens ne sont pas les mêmes...

Les solutions à base de RAID sont aujourd'hui tout à fait envisageables chez les particuliers, notamment grâce au RAID logiciel (ou semi-matériel) évitant d'avoir à investir dans une coûteuse carte contrôleur. Le coût de cette mesure peut donc se limiter au prix d'un 2ème disque dur et du temps passé à configurer le RAID... Il existe ensuite une multitude de logiciels proposant de sauvegarder vos fichiers sur disque USB, sur CD ou DVD, etc. La solution la plus abordable pour l'archivage reste le CD ou le DVD dont les rapports capacité/prix sont parmi les plus faibles, en attendant les baisses de prix des graveurs Blu-Ray. Enfin, pour l'externalisation de vos données, pensez à regarder du côté de votre fournisseur d'accès internet qui propose généralement un espace de stockage et/ou d'hébergement de site accessible par FTP ou par HTTP avec votre navigateur habituel.

Lorsqu'il y a plusieurs postes à protéger, mettre en place des mesures préventives sur chacune des machines peut rapidement devenir coûteux aussi bien en temps qu'en argent... L'idéal dans ce type de configuration est encore de laisser travailler les personnes sur un serveur de fichier dont les disques sont montés en RAID et les composants éventuellement redondés et d'effectuer les sauvegardes et les archivages sur le serveur ou les données sont centralisées. Cependant une telle politique n'est pas toujours possible, notamment avec les utilisateurs nomades ou les télétravailleurs. Dans ce cas, il existe des logiciels/solutions de sauvegarde permettant de centraliser les sauvegardes et d'éventuellement les externaliser automatiquement vers un serveur de stockage sur Internet. Pour l'archivage, l'utilisation de bandes magnétiques peut être avantageux, le prix élevé d'un lecteur de bandes étant amorti par le faible cout des supports. Comme pour les particuliers, pensez à regarder ce que peut vous proposer votre fournisseur d'accès, notamment au niveau de l'espace de stockage sur Internet pour les externalisations.