FAQ sur la mise en œuvre pratique du RAID. Conseils pratiques pour créer des matrices RAID sur des PC domestiques

Réseau RAID. Qu'est-ce que c'est? Pour quoi? Et comment créer ?

Au cours des longues décennies de développement de l'industrie informatique, les moyens de stockage d'informations pour ordinateurs ont connu une évolution sérieuse. Bandes perforées et cartes perforées, bandes et tambours magnétiques, disques magnétiques, optiques et magnéto-optiques, lecteurs à semi-conducteurs - ce n'est là qu'une courte liste de technologies déjà testées. Actuellement, des laboratoires du monde entier tentent de créer des dispositifs de stockage holographiques et quantiques qui augmenteront considérablement la densité d'enregistrement et la fiabilité de son stockage.

Entre-temps, les disques durs sont restés pendant longtemps le moyen le plus courant de stocker des informations sur un ordinateur personnel. Sinon, ils peuvent être appelés HDD (disques durs). disques magnétiques), disques durs, disques durs, mais l'essence ne change pas en changeant le nom - ce sont des disques avec le package disques magnétiques dans un seul bâtiment.

D'abord Disque dur, baptisé IBM 350, a été assemblé le 10 janvier 1955 dans le laboratoire de la société américaine IBM. Avec la taille d’une bonne armoire et un poids d’une tonne, ce disque dur pourrait contenir cinq mégaoctets d’informations. D'un point de vue moderne, un tel volume ne peut même pas être qualifié de drôle, mais lors de l'utilisation massive de cartes perforées et de bandes magnétiques avec accès en série, il s'agissait d'une avancée technologique colossale.


Téléchargement du premier disque dur IBM 350 depuis un avion

Moins de six décennies se sont écoulées depuis ce jour, mais désormais, vous ne surprendrez personne avec un disque dur pesant moins de deux cents grammes, dix centimètres de long et un volume d'informations de quelques téraoctets. Dans le même temps, la technologie d'enregistrement, de stockage et de lecture des données n'est pas différente de celle utilisée dans l'IBM 350 - les mêmes plaques magnétiques et têtes de lecture/écriture glissant au-dessus d'elles.


L'évolution des disques durs sur fond de règle en pouces (photo de " Wikipédia " )

Malheureusement, ce sont précisément les caractéristiques de cette technologie qui posent deux problèmes principaux liés à l'utilisation des disques durs. Le premier l'est aussi faible vitesseécrire, lire et transférer des informations du disque vers le processeur. DANS ordinateur moderne C'est le disque dur qui est le périphérique lent, qui détermine souvent les performances de l'ensemble du système dans son ensemble.

Le deuxième problème est la sécurité insuffisante des informations stockées sur le disque dur. Si votre disque dur tombe en panne, vous pouvez perdre irrémédiablement toutes les données qui y sont stockées. Et c'est bien si les pertes se limitent à la perte d'un album photo de famille (même si en réalité il n'y a pas grand-chose de bon à cela). La destruction d’informations financières et marketing importantes peut provoquer l’effondrement d’une entreprise.

Contribuer en partie à la protection des informations stockées est régulier sauvegarde(sauvegarde) toutes ou seulement les données importantes sur le disque dur. Mais même dans ce cas, en cas de panne, la partie des données mises à jour depuis la dernière sauvegarde sera perdue.

Heureusement, il existe des méthodes qui peuvent aider à surmonter les inconvénients ci-dessus des disques durs traditionnels. Une de ces méthodes consiste à créer des matrices RAID de plusieurs disques durs.

Qu'est-ce que le RAID

Sur Internet et même moderne littérature informatique On retrouve souvent le terme « matrice RAID », qui est en fait une tautologie, puisque l'abréviation RAID (redundant array of indépendant disks) signifie déjà « redundant array of indépendant disks ».

Le nom révèle pleinement la signification physique de telles baies - il s'agit d'un ensemble de deux disques durs ou plus. Collaboration Ces disques sont contrôlés par un contrôleur spécial. En raison du fonctionnement du contrôleur, ces baies sont perçues par le système d'exploitation comme un seul disque dur et l'utilisateur peut ne pas penser aux nuances liées à la gestion du fonctionnement de chaque disque dur séparément.

Il existe plusieurs types principaux de RAID, chacun ayant un impact différent sur la fiabilité globale et la vitesse de la matrice par rapport aux disques simples. Ils sont désignés par un nombre conventionnel de 0 à 6. Une désignation similaire avec une description détaillée de l'architecture et du principe de fonctionnement des baies a été proposée par des spécialistes de l'Université de Californie à Berkeley. En plus des sept principaux types de RAID, diverses combinaisons d'entre eux sont également possibles. Considérons-les plus en détail.

Ce type le plus simple une série de disques durs dont l'objectif principal est d'augmenter les performances du sous-système de disque de l'ordinateur. Ceci est réalisé en divisant les flux d'informations écrites (lues) en plusieurs sous-flux, qui sont simultanément écrits (lus) sur plusieurs disques durs. En conséquence, la vitesse totale d'échange d'informations, par exemple pour les baies à deux disques, augmente de 30 à 50 % par rapport à un disque dur du même type.

Le volume total du RAID 0 est égal à la somme des volumes des disques durs qui y sont inclus. Les informations sont divisées en blocs de données d'une longueur fixe, quelle que soit la longueur des fichiers enregistrés.

Le principal avantage du RAID 0 est une augmentation significative de la vitesse d'échange d'informations entre système de disque sans perdre la capacité utile des disques durs. L'inconvénient est une diminution de la fiabilité globale du système de stockage. Si l'un des disques RAID 0 tombe en panne, toutes les informations enregistrées dans la matrice sont perdues à jamais.

Semblable à celui évoqué ci-dessus, ce type de tableau est également le plus simple à organiser. Il est construit sur la base de deux disques durs, chacun étant le reflet exact (miroir) de l'autre. Les informations sont écrites en parallèle sur les deux disques de la baie. Les données sont lues simultanément sur les deux disques par blocs séquentiels (parallélisation des requêtes), grâce à quoi une légère augmentation de la vitesse de lecture est obtenue par rapport à un seul disque dur.

La capacité totale du RAID 1 est égale à la capacité du plus petit disque dur de la matrice.

Avantages du RAID 1 : haute fiabilité du stockage des informations (les données ne sont pas endommagées tant qu'au moins un des disques inclus dans la matrice est intact) et une certaine augmentation de la vitesse de lecture. Inconvénient - en acheter deux disques durs, vous obtenez le volume utilisable d’un seul. Malgré la perte de la moitié du volume utile, les baies "miroirs" sont très populaires en raison de leur grande fiabilité et de leur coût relativement faible - une paire de disques coûte toujours moins cher que quatre ou huit.

Lors de la construction de ces tableaux, un algorithme de récupération d'informations est utilisé à l'aide des codes de Hamming (un ingénieur américain qui a développé cet algorithme en 1950 pour corriger les erreurs de fonctionnement des ordinateurs électromécaniques). Pour assurer le fonctionnement de ce contrôleur RAID, deux groupes de disques sont créés - un pour stocker les données, le deuxième groupe pour stocker les codes de correction d'erreurs.

Ce type de RAID est devenu moins répandu dans les systèmes domestiques en raison de la redondance excessive du nombre de disques durs - par exemple, dans une matrice de sept disques durs, seuls quatre seront alloués aux données. À mesure que le nombre de disques augmente, la redondance diminue, comme le reflète le tableau ci-dessous.

Le principal avantage du RAID 2 est la possibilité de corriger les erreurs à la volée sans réduire la vitesse d'échange des données entre la matrice de disques et le processeur central.

RAID 3 et RAID 4

Ces deux types de baies de disques sont de conception très similaire. Les deux utilisent plusieurs disques durs pour stocker les informations, dont l'un est utilisé exclusivement pour stocker les sommes de contrôle. Trois disques durs suffisent pour créer du RAID 3 et du RAID 4. Contrairement au RAID 2, la récupération des données « à la volée » est impossible : les informations sont restaurées après avoir remplacé celles qui sont sorties. construire un dur disque pendant un certain temps.

La différence entre RAID 3 et RAID 4 réside dans le niveau de partitionnement des données. Dans RAID 3, les informations sont décomposées en octets individuels, ce qui entraîne un ralentissement important lors de l'écriture/lecture d'un grand nombre de petits fichiers. RAID 4 divise les données en blocs séparés dont la taille ne dépasse pas la taille d'un secteur du disque. En conséquence, la vitesse de traitement des petits fichiers augmente, ce qui est essentiel pour les ordinateurs personnels. C'est pour cette raison que le RAID 4 est devenu plus répandu.

Un inconvénient important des baies considérées est la charge accrue sur le disque dur destiné au stockage des sommes de contrôle, ce qui réduit considérablement ses ressources.

Les baies de disques de ce type sont en réalité un développement du schéma RAID 3/RAID 4. Particularité est qu'un disque séparé n'est pas utilisé pour stocker les sommes de contrôle - elles sont réparties uniformément sur tous les disques durs de la baie. Le résultat de la distribution est la possibilité d'enregistrer en parallèle sur plusieurs disques à la fois, ce qui augmente légèrement la vitesse d'échange de données par rapport à RAID 3 ou RAID 4. Cependant, cette augmentation n'est pas si significative, car des ressources système supplémentaires sont consacrées au calcul sommes de contrôle à l’aide de l’opération « ou exclusif ». Dans le même temps, la vitesse de lecture augmente considérablement, puisqu'une simple parallélisation du processus est possible.

Le nombre minimum de disques durs pour créer un RAID 5 est de trois.

Les baies construites à l'aide du schéma RAID 5 ont des caractéristiques très inconvénient majeur. Si un disque tombe en panne après son remplacement, la restauration complète des informations prend plusieurs heures. À l'heure actuelle, les disques durs intacts de la baie fonctionnent en mode super-intensif, ce qui augmente considérablement le risque de panne du deuxième disque et de perte totale d'informations. Bien que rare, cela arrive. De plus, lors de la restauration RAID 5, la matrice est presque entièrement occupée par ce processus et les opérations d'écriture/lecture en cours sont effectuées avec des délais importants. Si pour la majorité utilisateurs ordinaires Ce n'est pas critique, mais dans le secteur des entreprises, de tels retards peuvent entraîner certaines pertes financières.

Dans une large mesure, le problème ci-dessus est résolu en construisant des matrices selon le schéma RAID 6. Dans ces structures, des sommes de contrôle sont stockées, qui sont également réparties de manière cyclique et uniforme sur différents disques, la quantité de mémoire égale à la capacité de deux disques durs est allouée. Au lieu d'une, deux sommes de contrôle sont calculées, ce qui garantit l'intégrité des données en cas de panne simultanée de deux disques durs de la baie.

Les avantages du RAID 6 sont un degré élevé de sécurité des informations et une perte de performances moindre qu'en RAID 5 lors de la récupération des données lors du remplacement d'un disque endommagé.

Inconvénient du RAID 6 - réduction vitesse globaleéchange de données d'environ 10 % en raison d'une augmentation du volume des calculs de somme de contrôle nécessaires, ainsi que d'une augmentation du volume d'informations écrites/lues.

Types RAID combinés

En plus des principaux types évoqués ci-dessus, diverses combinaisons d'entre eux sont largement utilisées, qui compensent certains inconvénients du RAID simple. En particulier, l'utilisation des schémas RAID 10 et RAID 0+1 est largement répandue. Dans le premier cas, deux matrices en miroir sont combinées en RAID 0, dans le second, au contraire, deux RAID 0 sont combinées en un miroir. Dans les deux cas, RAID 1 s'ajoute à la sécurité des informations productivité accrue RAID0.

Souvent afin d'augmenter le niveau de protection une information important Des schémas de construction RAID 51 ou RAID 61 sont utilisés - la mise en miroir de matrices déjà hautement protégées garantit une sécurité exceptionnelle des données en cas de panne. Cependant, il n’est pas pratique de mettre en œuvre de tels réseaux à la maison en raison d’une redondance excessive.

Construire une baie de disques - de la théorie à la pratique

Un contrôleur RAID spécialisé est responsable de la création et de la gestion du fonctionnement de tout RAID. Au grand soulagement de l'utilisateur moyen ordinateur personnel, dans la plupart des cartes mères modernes, ces contrôleurs sont déjà implémentés au niveau pont sud jeu de puces. Ainsi, pour constituer une matrice de disques durs, il vous suffit d'en acheter le nombre requis et de déterminer le type RAID souhaité dans la section appropriée des paramètres du BIOS. Après cela, au lieu de plusieurs disques durs dans le système, vous n'en verrez qu'un, qui peut être divisé en partitions et lecteurs logiques si vous le souhaitez. Veuillez noter que ceux qui utilisent encore Windows XP devront installer un pilote supplémentaire.

Contrôleur RAID externe avec quatre ports SATA

Notez qu'en règle générale, les contrôleurs intégrés sont capables de créer du RAID 0, du RAID 1 et des combinaisons de ceux-ci. La création de baies plus complexes nécessitera toujours l'achat d'un contrôleur séparé.

Et enfin, encore un conseil : pour créer un RAID, achetez des disques durs de même capacité, du même fabricant, du même modèle, et de préférence du même lot. Ils seront alors équipés des mêmes ensembles logiques et le fonctionnement de la matrice de ces disques durs sera le plus stable.

Salutations à tous, chers lecteurs du site blog. Je pense que beaucoup d'entre vous ont rencontré au moins une fois une expression aussi intéressante sur Internet - « Matrice RAID ». Ce que cela signifie et pourquoi l’utilisateur moyen pourrait en avoir besoin, c’est ce dont nous parlerons aujourd’hui. C’est un fait bien connu qu’il s’agit du composant le plus lent d’un PC et qu’il est inférieur au processeur.

Pour compenser la lenteur « innée » là où elle est complètement déplacée (nous parlons principalement de serveurs et de PC hautes performances), ils ont imaginé l'utilisation d'une matrice de disques dite RAID - une sorte de « bundle » de plusieurs disques durs identiques fonctionnant en parallèle. Cette solution permet d'augmenter considérablement la rapidité de fonctionnement couplée à la fiabilité.

Tout d'abord, une matrice RAID vous permet d'offrir une tolérance élevée aux pannes pour les disques durs (HDD) de votre ordinateur en combinant plusieurs disques durs en un seul élément logique. Par conséquent, pour mettre en œuvre cette technologie, vous aurez besoin d'au moins deux disques durs. De plus, le RAID est tout simplement pratique, car toutes les informations qui devaient auparavant être copiées sur des sources de sauvegarde (disques durs externes) peuvent désormais être laissées « telles quelles », car le risque de perte totale est minime et tend vers zéro, mais pas toujours, à ce sujet un peu plus bas.

RAID se traduit à peu près ainsi : un ensemble protégé de disques bon marché. Le nom vient de l’époque où les grands disques durs étaient très chers et où il était moins coûteux d’assembler une matrice commune de disques plus petits. L'essence n'a pas changé depuis lors, en général, tout comme le nom, ce n'est que maintenant que vous pouvez créer un stockage gigantesque à partir de plusieurs grands disques durs, ou faire en sorte qu'un disque en duplique un autre. Vous pouvez également combiner les deux fonctions, bénéficiant ainsi des avantages de l’une et de l’autre.

Tous ces tableaux portent leurs propres numéros, vous en avez probablement entendu parler - raid 0, 1...10, c'est-à-dire des tableaux de différents niveaux.

Types de RAID

Raid de vitesse 0

Le Raid 0 n'a rien à voir avec la fiabilité, car il ne fait qu'augmenter la vitesse. Vous avez besoin d'au moins 2 disques durs, et dans ce cas les données seront « coupées » et écrites sur les deux disques simultanément. Autrement dit, vous aurez accès à toute la capacité de ces disques, ce qui signifie théoriquement que vous obtiendrez des vitesses de lecture/écriture 2 fois plus élevées.

Mais imaginons que l'un de ces disques tombe en panne : dans ce cas, la perte de TOUTES vos données est inévitable. Autrement dit, vous devrez quand même faire des sauvegardes régulières afin de pouvoir restaurer les informations ultérieurement. Généralement, 2 à 4 disques sont utilisés ici.

Raid 1 ou « miroir »

La fiabilité n'est pas compromise ici. Vous bénéficiez de l'espace disque et des performances d'un seul disque dur, mais vous bénéficiez d'une fiabilité deux fois supérieure. Un disque tombe en panne - les informations seront enregistrées sur l'autre.

La matrice de niveau RAID 1 n'affecte pas la vitesse, mais le volume - ici, vous n'avez à votre disposition que la moitié de l'espace disque total, dont, soit dit en passant, dans RAID 1, il peut y en avoir 2, 4, etc., qui c'est-à-dire un nombre pair. En général, la principale caractéristique d’un raid de premier niveau est la fiabilité.

Raid 10

Combine tout le meilleur des types précédents. Je propose de regarder comment cela fonctionne en utilisant l'exemple de quatre disques durs. Ainsi, les informations sont écrites en parallèle sur deux disques, et ces données sont dupliquées sur deux autres disques.

Le résultat est une multiplication par 2 de la vitesse d'accès, mais également de la capacité de seulement deux des quatre disques de la baie. Mais si deux disques tombent en panne, aucune perte de données ne se produira.

Raid 5

Ce type de matrice est très similaire au RAID 1 dans son objectif, seulement maintenant vous avez besoin d'au moins 3 disques, l'un d'eux stockera les informations nécessaires à la récupération. Par exemple, si une telle matrice contient 6 disques durs, seuls 5 d'entre eux seront utilisés pour enregistrer des informations.

Du fait que les données sont écrites sur plusieurs disques durs à la fois, la vitesse de lecture est élevée, ce qui est parfait pour y stocker une grande quantité de données. Mais sans un contrôleur raid coûteux, la vitesse ne sera pas très élevée. À Dieu ne plaise, l'un des disques tombe en panne - la restauration des informations prendra beaucoup de temps.

Raid 6

Cette baie peut survivre à la panne de deux disques durs à la fois. Cela signifie que pour créer une telle matrice, vous aurez besoin d'au moins quatre disques, malgré le fait que la vitesse d'écriture sera encore inférieure à celle du RAID 5.

Veuillez noter que sans un contrôleur RAID puissant, il est peu probable qu'un tel tableau (6) soit assemblé. Si vous ne disposez que de 4 disques durs, il est préférable de construire un RAID 1.

Comment créer et configurer une matrice RAID

Contrôleur RAID

Une matrice RAID peut être créée en connectant plusieurs disques durs à une carte mère d'ordinateur prenant en charge cette technologie. Cela signifie qu'une telle carte mère dispose d'un contrôleur intégré, généralement intégré au . Mais le contrôleur peut également être externe, connecté via un connecteur PCI ou PCI-E. En règle générale, chaque contrôleur possède son propre logiciel de configuration.

Le raid peut être organisé aussi bien au niveau matériel qu'au niveau logiciel, cette dernière option étant la plus courante parmi les PC domestiques. Les utilisateurs n'aiment pas le contrôleur intégré à la carte mère en raison de sa faible fiabilité. De plus, si la carte mère est endommagée, la récupération des données sera très problématique. Au niveau logiciel, le rôle du contrôleur est joué, si quelque chose arrive, vous pouvez facilement transférer votre matrice raid sur un autre PC.

Matériel

Comment réaliser une matrice RAID ? Pour ce faire, vous avez besoin de :

  1. Obtenez-le quelque part avec la prise en charge du raid (en cas de RAID matériel) ;
  2. Achetez au moins deux disques durs identiques. Il est préférable qu'ils soient identiques non seulement en termes de caractéristiques, mais également du même fabricant et du même modèle, et connectés au tapis. Conseil en utilisant un.
  3. Transférez toutes les données de vos disques durs vers d'autres supports, sinon elles seront détruites lors du processus de création du raid.
  4. Ensuite, vous devrez activer la prise en charge RAID dans le BIOS, mais je ne peux pas vous dire comment procéder dans le cas de votre ordinateur, car le BIOS de chacun est différent. Habituellement, ce paramètre est appelé quelque chose comme ceci : « Configuration SATA ou Configurer SATA en RAID ».
  5. Redémarrez ensuite votre PC et un tableau avec des paramètres de raid plus détaillés devrait apparaître. Vous devrez peut-être appuyer sur la combinaison de touches "ctrl+i" pendant la procédure POST pour que ce tableau apparaisse. Pour ceux qui ont contrôleur externe Très probablement, vous devrez appuyer sur « F2 ». Dans le tableau lui-même, cliquez sur « Créer un massif » et sélectionnez le niveau de tableau requis.

Après avoir créé une matrice RAID dans le BIOS, vous devez accéder à la « gestion des disques » dans OS –10 et formater la zone non allouée - c'est notre matrice.

Programme

Pour créer un RAID logiciel, vous n'avez pas besoin d'activer ou de désactiver quoi que ce soit dans le BIOS. En fait, vous n'avez même pas besoin de prendre en charge le raid sur votre carte mère. Comme mentionné ci-dessus, la technologie est mise en œuvre via processeur central Outils PC et Windows lui-même. Oui, vous n'avez même pas besoin d'installer de logiciel tiers. Certes, de cette manière, vous ne pouvez créer qu'un RAID du premier type, qui est un « miroir ».

Cliquez sur clic-droit Allez dans « mon ordinateur » – « gérer » – « gestion des disques ». Cliquez ensuite sur l'un des disques durs destinés au raid (disque 1 ou disque 2) et sélectionnez « Créer un volume miroir ». Dans la fenêtre suivante, sélectionnez un disque qui sera le miroir d'un autre disque dur, puis attribuez une lettre et formatez la partition finale.

Dans cet utilitaire, les volumes en miroir sont surlignés d'une seule couleur (rouge) et sont désignés par une lettre. Dans ce cas, les fichiers sont copiés sur les deux volumes, une fois sur un volume, et le même fichier est copié sur le deuxième volume. Il est à noter que dans la fenêtre « Mon ordinateur », notre tableau sera affiché comme une seule section, la deuxième section est masquée pour ne pas être une horreur, car les mêmes fichiers en double s'y trouvent.

Si un disque dur tombe en panne, l'erreur « Failed Redundancy » apparaîtra, tandis que tout sur la deuxième partition restera intact.

Résumons

RAID 5 est nécessaire pour une gamme limitée de tâches, lorsqu'un nombre beaucoup plus important de disques durs (que 4 disques) sont assemblés dans d'énormes baies. Pour la plupart des utilisateurs, le raid 1 est la meilleure option. Par exemple, s'il y a quatre disques d'une capacité de 3 téraoctets chacun, en RAID 1 dans ce cas, 6 téraoctets de capacité sont disponibles. RAID 5 dans ce cas fournira plus d'espace, cependant, la vitesse d'accès diminuera considérablement. RAID 6 donnera les mêmes 6 téraoctets, mais une vitesse d'accès encore plus faible, et nécessitera également un contrôleur coûteux.

Ajoutons plus de disques RAID et vous verrez comment tout change. Par exemple, prenons huit disques de même capacité (3 téraoctets). En RAID 1, seuls 12 téraoctets d'espace seront disponibles pour l'enregistrement, la moitié du volume sera fermé ! RAID 5 dans cet exemple donnera 21 téraoctets d'espace disque + il sera possible d'obtenir des données de n'importe quel disque dur endommagé. RAID 6 donnera 18 téraoctets et les données pourront être obtenues à partir de deux disques quelconques.

En général, le RAID n'est pas une chose bon marché, mais personnellement, j'aimerais avoir à ma disposition un RAID du premier niveau de disques de 3 téraoctets. Il existe des méthodes encore plus sophistiquées, comme le RAID 6 0, ou le « raid from raid arrays », mais cela a du sens avec un grand nombre de disques durs, au moins 8, 16 ou 30 - vous devez en convenir, cela dépasse largement le cadre de usage « domestique » ordinaire et la demande d’utilisation concerne principalement les serveurs.

Quelque chose comme ça, laissez des commentaires, ajoutez le site aux favoris (pour plus de commodité), il y aura bien d'autres choses intéressantes et utiles, et à bientôt sur les pages du blog !

Matrice RAID (Redundant Array of Independent Disks) - connectant plusieurs périphériques pour augmenter les performances et/ou la fiabilité du stockage des données, en traduction - une matrice redondante de disques indépendants.

Selon la loi de Moore, la productivité actuelle augmente chaque année (c'est-à-dire que le nombre de transistors sur une puce double tous les 2 ans). Cela peut être constaté dans presque toutes les industries du matériel informatique. Les processeurs augmentent le nombre de cœurs et de transistors, tout en réduisant le processus, la RAM augmente la fréquence et débit,La mémoire SSD améliore l'endurance et la vitesse de lecture.

Mais les simples disques durs (HDD) n’ont pas beaucoup progressé au cours des 10 dernières années. Comme la vitesse standard était de 7 200 tr/min, elle le reste (sans tenir compte des disques durs de serveur avec des révolutions de 10 000 ou plus). On trouve encore des vitesses lentes de 5 400 tr/min sur les ordinateurs portables. Pour la plupart des utilisateurs, afin d'augmenter les performances de leur ordinateur, il sera plus pratique d'acheter un SDD, mais le prix de 1 Go d'un tel support est bien supérieur à celui d'un simple disque dur. « Comment augmenter les performances des disques sans perdre beaucoup d'argent et de volume ? Comment sauvegarder vos données ou augmenter la sécurité de vos données ? Il existe une réponse à ces questions : une matrice RAID.

Types de matrices RAID

Actuellement, les types de matrices RAID suivants existent :

RAID 0 ou "Striping"– une matrice de deux disques ou plus pour améliorer les performances globales. Le volume du raid sera total (HDD 1 + HDD 2 = Volume total), la vitesse de lecture/écriture sera plus élevée (en raison de la division de l'enregistrement sur 2 appareils), mais la fiabilité de la sécurité des informations en souffrira. Si l'un des appareils tombe en panne, toutes les informations de la matrice seront perdues.

RAID 1 ou "Miroir"– plusieurs disques se copiant pour augmenter la fiabilité. La vitesse d'écriture reste au même niveau, la vitesse de lecture augmente, la fiabilité augmente plusieurs fois (même si un appareil tombe en panne, le second fonctionnera), mais le coût de 1 gigaoctet d'informations augmente de 2 fois (si vous créez un tableau de deux disques durs).

RAID 2 est une matrice construite sur des disques pour stocker des informations et des disques de correction d'erreurs. Le nombre de disques durs pour stocker les informations est calculé à l'aide de la formule « 2^n-n-1 », où n est le nombre de corrections du disque dur. Ce type est utilisé lorsqu'il existe un grand nombre de disques durs, le nombre minimum acceptable est de 7, où 4 est destiné au stockage des informations et 3 au stockage des erreurs. L'avantage de ce type sera des performances accrues par rapport à un seul disque.

RAID 3 – se compose de disques « n-1 », où n est un disque pour stocker les blocs de parité, les autres sont des périphériques pour stocker des informations. Les informations sont divisées en morceaux plus petits que la taille du secteur (divisés en octets), bien adaptés pour travailler avec des fichiers volumineux, la vitesse de lecture des petits fichiers est très faible. Caractérisé par des performances élevées, mais une faible fiabilité et une spécialisation étroite.

RAID 4 est similaire au type 3, mais est divisé en blocs plutôt qu'en octets. Cette solution a permis de corriger la faible vitesse de lecture des petits fichiers, mais la vitesse d'écriture est restée faible.

RAID 5 et 6 - au lieu d'un disque séparé pour la corrélation des erreurs, comme dans les versions précédentes, des blocs sont utilisés, répartis uniformément sur tous les périphériques. Dans ce cas, la vitesse de lecture/écriture des informations augmente en raison de la parallélisation de l'enregistrement. L'inconvénient de ce type est la récupération à long terme des informations en cas de panne de l'un des disques. Pendant la récupération, une charge très élevée est appliquée aux autres périphériques, ce qui réduit la fiabilité et augmente la panne d'un autre périphérique ainsi que la perte de toutes les données de la baie. Le type 6 améliore la fiabilité globale mais réduit les performances.

Combiné types de RAID tableaux :

RAID 01 (0+1) – Deux Raid 0 sont combinés en Raid 1.

RAID10 (1+0) – baies de disques RAID 1, qui sont utilisés dans l'architecture de type 0. Il est considéré comme l’option de stockage de données la plus fiable, alliant fiabilité et performances élevées.

Vous pouvez également créer un tableau depuis Disques SSD . Selon les tests de 3DNews, une telle combinaison n'apporte pas d'augmentation significative. Il est préférable d'acheter un disque avec une interface PCI ou eSATA plus puissante

Tableau Raid : comment créer

Créé en se connectant via un contrôleur RAID spécial. Il existe actuellement 3 types de contrôleurs :

  1. Logiciel - logiciel un tableau est émulé, tous les calculs sont effectués par le CPU.
  2. Intégré – principalement courant sur les cartes mères (pas sur le segment des serveurs). Un petit éclat au passe-partout. carte chargée d'émuler la matrice, les calculs sont effectués via le CPU.
  3. Matériel – carte d'extension (pour ordinateurs de bureau), généralement avec Interface PCI, a propre mémoire et un processeur informatique.

Matrice de disques durs RAID : comment la créer à partir de 2 disques via IRST


Récupération de données

Quelques options de récupération de données :

  1. Si Raid 0 ou 5 échoue, l'utilitaire RAID Reconstructor peut vous aider, qui assemblera informations disponibles lecteurs et réécrivez-le sur un autre périphérique ou support sous la forme d’une image de la matrice précédente. Cette option sera utile si les disques fonctionnent correctement et que l'erreur est logicielle.
  2. Pour Systèmes Linux mdadm recovery est utilisé (un utilitaire de gestion des baies logicielles Raid).
  3. La récupération du matériel doit être effectuée par l'intermédiaire de services spécialisés, car sans connaissance des méthodes de fonctionnement du contrôleur, vous pouvez perdre toutes les données et il sera très difficile, voire impossible, de les récupérer.

De nombreuses nuances doivent être prises en compte lors de la création d'un raid sur votre ordinateur. Fondamentalement, la plupart des options sont utilisées dans le segment des serveurs, où la stabilité et la sécurité des données sont importantes et nécessaires. Si vous avez des questions ou des ajouts, vous pouvez les laisser dans les commentaires.

Passe une bonne journée!

RAID (matrice redondante de disques indépendants)— une matrice redondante de disques indépendants, c'est-à-dire combiner des disques durs physiques en un seul disque logique pour résoudre tous les problèmes. Très probablement, vous l'utiliserez pour la tolérance aux pannes. Si l'un des disques tombe en panne, le système continuera à fonctionner. DANS système opérateur la matrice ressemblera à un disque dur ordinaire. RAID– les baies sont originaires du segment des solutions serveur, mais sont désormais très répandues et sont déjà utilisées à la maison. Pour gérer le RAID, une puce spéciale intelligente est utilisée, appelée contrôleur RAID. Il s'agit soit d'un chipset sur la carte mère, soit d'une carte externe séparée.

Types de matrices RAID

Matériel– c'est à ce moment-là que l'état du réseau est contrôlé par une puce spéciale. La puce possède son propre processeur et tous les calculs reposent sur elle, libérant ainsi le processeur du serveur d'une charge inutile.

Programme– c'est à ce moment-là que l'état du tableau est contrôlé programme spécial dans le système d'exploitation. Dans ce cas, une charge supplémentaire sera créée sur le CPU du serveur. Après tout, tous les calculs lui incombent.

Il est impossible de dire sans équivoque quel type de raid est le meilleur. En cas de raid logiciel, nous n'avons pas besoin d'acheter un contrôleur raid coûteux. Ce qui coûte généralement à partir de 250 USD. (vous pouvez le trouver pour 70 $, mais je ne risquerais pas les données) Mais tous les calculs relèvent du processeur du serveur. Logiciel

l'implémentation est bien adaptée aux raids 0 et 1. Ils sont assez simples et ne nécessitent pas de gros calculs pour fonctionner. Par conséquent, les raids logiciels sont plus souvent utilisés dans les solutions niveau d'entrée. Le raid matériel utilise un contrôleur raid pour fonctionner. Le contrôleur RAID possède son propre processeur pour les calculs, et c'est ce processeur qui effectue les opérations d'E/S.

Niveaux RAID-tableaux

Il y en a beaucoup. Ce sont les principaux - 0, 1, 2, 3, 4, 5, 6, 7 et les combinés - 10, 30, 50, 53... Nous ne considérerons que les plus populaires, utilisés dans les entreprises modernes. Infrastructure. La lettre D dans les diagrammes signifie Data ou bloc de données.

RAID 0 (matrice de disques répartis sans tolérance de panne)

Aka rayure. C'est lorsque deux ou plusieurs disques physiques sont combinés en un seul disque logique dans le but de combiner l'espace. Autrement dit, nous prenons deux disques de 500 Go, les combinons en RAID 0 et dans le système, nous voyons 1 disque dur d'une capacité de 1 To. Les informations sont réparties uniformément sur tous les disques RAID sous la forme de petits blocs (bandes).

Avantages – Hautes performances, facilité de mise en œuvre.

Inconvénients : manque de tolérance aux pannes. Lors de l'utilisation de ce raid, la fiabilité du système est réduite de moitié (si nous utilisons deux disques). Après tout, si au moins un disque tombe en panne, vous perdez toutes vos données.

RAID 1 (mise en miroir et duplexage)

Autrement dit, miroir. C'est lorsque deux disques physiques ou plus sont combinés en un seul disque logique pour améliorer la tolérance aux pannes. Les informations sont écrites sur les deux disques de la baie en même temps et lorsque l'un d'eux quitte, les informations sont stockées sur l'autre.

Avantages : vitesse de lecture/écriture élevée, facilité de mise en œuvre.

Inconvénients : redondance élevée. En cas d'utilisation de 2 disques, cela représente 100 %.

RAID1E

RAID 1E fonctionne comme ceci : trois disques physiques sont combinés en une matrice, après quoi un volume logique est créé. Les données sont réparties sur des disques, formant des blocs. Une donnée (bande) marquée ** est une copie de la donnée précédente *. Dans ce cas, chaque bloc de la copie miroir est écrit avec un décalage sur un disque

La solution tolérante aux pannes la plus simple à mettre en œuvre est le RAID 1 (mise en miroir), reflet du miroir deux disques. La haute disponibilité des données est garantie par la présence de deux copies complètes. Cette redondance de la structure du réseau affecte son coût - après tout, la capacité utile est la moitié de celle utilisée. Étant donné que RAID 1 est construit sur deux disques durs, cela n'est clairement pas suffisant pour les applications modernes gourmandes en disques. En raison de ces exigences, la portée du RAID 1 est généralement limitée aux volumes de services (OS, SWAP, LOG) ; ils ne sont utilisés que dans des solutions à petit budget pour héberger les données des utilisateurs.

RAID 1E est une combinaison de distribution d'informations sur les disques (striping) à partir de RAID 0 et de mise en miroir à partir de RAID 1. Simultanément à l'écriture d'une zone de données sur un disque, une copie de celle-ci est créée sur le disque suivant de la matrice. La différence avec le RAID 1 est que le nombre de disques durs peut être impair (minimum 3). Comme pour RAID 1, la capacité utilisable représente 50 % de la capacité totale des disques de la matrice. Certes, si le nombre de disques est pair, il est préférable d'utiliser RAID 10, qui, avec la même utilisation de capacité, se compose de deux (ou plus) « miroirs ». Si l'un des disques RAID 1E tombe en panne physiquement, le contrôleur bascule les requêtes de lecture et d'écriture vers les disques restants de la matrice.

Avantages :

  • haute sécurité des données ;
  • bonne performance.

Défauts:

  • comme le RAID 1, seulement 50 % de la capacité disque de la matrice est utilisée.

RAID2

Dans les baies de ce type, les disques sont divisés en deux groupes - pour les données et pour les codes de correction d'erreurs, et si les données sont stockées sur des disques, des disques sont alors nécessaires pour stocker les codes de correction. Les données sont écrites sur les disques correspondants de la même manière qu'en RAID 0 : elles sont divisées en petits blocs en fonction du nombre de disques destinés à stocker les informations. Les disques restants stockent des codes de correction d'erreur, qui peuvent être utilisés pour restaurer des informations en cas de panne d'un disque dur. La méthode Hamming est utilisée depuis longtemps dans la mémoire ECC et permet la correction à la volée des erreurs simples et la détection des erreurs doubles.

L'inconvénient de la matrice RAID 2 est que son fonctionnement nécessite une structure presque double du nombre de disques, ce type de matrice n'est donc pas répandu.

RAID3

Dans une matrice de disques RAID 3, les données sont divisées en morceaux plus petits qu'un secteur (divisés en octets) ou un bloc et réparties sur les disques. Un autre disque est utilisé pour stocker les blocs de parité. RAID 2 utilisait un disque à cet effet, mais la plupart des informations sur les disques de contrôle étaient utilisées pour la correction d'erreurs à la volée, tandis que la plupart des utilisateurs se contentent de simplement restaurer les informations en cas de panne de disque, ce qui est suffisant. pour tenir sur un disque dur dédié.

Différences entre RAID 3 et RAID 2 : l'impossibilité de corriger les erreurs à la volée et moins de redondance.

Avantages :

  • lecture et écriture de données à grande vitesse ;
  • Le nombre minimum de disques pour créer une baie est de trois.

Défauts:

  • un tableau de ce type n'est bon que pour le travail en une seule tâche avec des fichiers volumineux, car le temps d'accès à un secteur individuel, réparti sur les disques, est égal au maximum des intervalles d'accès aux secteurs de chaque disque. Pour les petits blocs, le temps d’accès est bien plus long que le temps de lecture.
  • il y a une charge importante sur le disque de contrôle et, par conséquent, sa fiabilité diminue considérablement par rapport aux disques stockant des données.

RAID4

RAID 4 est similaire au RAID 3, mais diffère en ce que les données sont divisées en blocs plutôt qu'en octets. Ainsi, il a été possible de surmonter en partie le problème de la faible vitesse de transfert de données pour les petits volumes. L'écriture est lente car la parité du bloc est générée lors de l'enregistrement et écrite sur un seul disque. Parmi les systèmes de stockage largement utilisés, RAID-4 est utilisé sur les périphériques de stockage de NetApp (NetApp FAS), où ses défauts sont éliminés avec succès grâce au fonctionnement des disques dans régime spécial enregistrement de groupe, déterminé par celui utilisé sur les appareils internes système de fichiers WAFL.

RAID 5 (disques de données indépendants avec blocs de parité distribués)

Le type de baie RAID le plus populaire, en général, en raison de la rentabilité de l'utilisation des supports de stockage. Les blocs de données et les sommes de contrôle sont écrits de manière cyclique sur tous les disques de la baie. Si l'un des disques tombe en panne, les performances seront sensiblement réduites, puisque des manipulations supplémentaires devront être effectuées pour que la baie fonctionne. Le raid lui-même a des vitesses de lecture/écriture assez bonnes mais est légèrement inférieure au RAID 1. Vous avez besoin d'au moins trois disques pour organiser le RAID 5.

Avantages - utilisation économique des médias, bonne vitesse lire écrire. La différence de performances par rapport au RAID 1 n'est pas aussi perceptible que les économies d'espace disque. Dans le cas de l'utilisation de trois disques durs, la redondance n'est que de 33 %.

Minus - récupération complexe données et mise en œuvre.

RAID5E

RAID 5E fonctionne comme ça. Une matrice est assemblée à partir de quatre disques physiques et un disque logique y est créé. Un disque de rechange distribué est espace libre. Les données sont distribuées sur les lecteurs, créant des blocs sur un disque logique. Les sommes de contrôle sont également réparties sur les disques de la matrice et écrites avec un décalage de disque en disque, comme dans RAID 5. Le disque dur de sauvegarde reste vide.

Le RAID 5 « classique » est considéré depuis de nombreuses années comme la norme en matière de tolérance aux pannes. sous-systèmes de disque. Il utilise la distribution des données (striping) sur la matrice HDD ; pour chacune des parties (stripe) qui y sont définies, des sommes de contrôle (parité) sont calculées et écrites. En conséquence, la vitesse d'enregistrement diminue en raison du recalcul constant du CS avec l'arrivée de nouvelles données. Pour augmenter les performances, les enregistrements CS sont répartis sur tous les disques RAID, en alternance avec les données. Le stockage des CD consomme la capacité d'un support, donc RAID 5 utilise un disque de moins que le nombre total de disques de la matrice. RAID 5 nécessite un minimum de trois (et un maximum de 16) disques durs, et son efficacité en matière d'espace disque est comprise entre 67 et 94 % en fonction du nombre de disques. C'est évidemment plus que le RAID 1, qui utilise 50 % de la capacité disponible.

La faible surcharge liée à la mise en œuvre de la redondance RAID 5 entraîne une mise en œuvre plutôt complexe et un long processus de récupération des données. Le calcul des sommes de contrôle et des adresses est confié au contrôleur RAID matériel avec des exigences élevées sur son processeur, sa logique et sa mémoire cache. Les performances d'une matrice RAID 5 dans son état dégradé sont extrêmement faibles et le temps de récupération se mesure en heures. De ce fait, le problème d'inadéquation de la matrice est aggravé par le risque de panne répétée de l'un des disques avant la restauration du RAID. Cela entraîne la destruction du volume de données.

Une approche courante consiste à inclure un disque de secours dédié dans RAID 5 pour réduire les temps d'arrêt avant le remplacement physique. disque défaillant. Après la panne de l'un des disques de la matrice d'origine, le contrôleur inclut un disque de rechange dans la matrice et commence le processus de reconstruction RAID. Il est important de préciser qu'avant cette première panne, le disque de sauvegarde est inactif et peut ne pas participer au fonctionnement de la baie pendant des années et ne peut pas être vérifié pour les erreurs de surface. Tout comme celui qui sera ensuite apporté pour un remplacement sous garantie au lieu de celui défectueux, sera inséré dans le panier de disques et désigné comme sauvegarde. Une grande surprise pourrait être son inopérabilité, et cela deviendra clair au moment le plus inopportun.

RAID 5E est un RAID 5 avec un disque de secours permanent inclus dans la matrice, dont la capacité est ajoutée de manière égale à chaque élément de la matrice. RAID 5E nécessite un minimum de quatre disques durs. Comme pour RAID 5, les données et les sommes de contrôle sont réparties sur les disques de la matrice. L'utilisation de la capacité utile dans RAID 5E est légèrement inférieure, mais les performances sont supérieures à celles du RAID 5 avec hot-spare.

La capacité d'un volume logique RAID 5E est inférieure à la capacité totale du volume de deux supports (la capacité de l'un est utilisée pour les sommes de contrôle, l'autre pour le remplacement à chaud). Mais lire et écrire font quatre appareils physiques RAID 5E est plus rapide que les opérations avec trois disques physiques RAID 5 avec hot-spare classique (tandis que le quatrième, hot-spare, ne participe pas à l'opération). Le disque de sauvegarde en RAID 5E est un membre permanent à part entière de la matrice. Il ne peut pas être affecté à la sauvegarde de deux baies différentes (« un serviteur de deux maîtres » – comme cela est autorisé dans RAID 5).

Si l'un des disques physiques tombe en panne, les données du lecteur défaillant sont restaurées. La baie est compressée et le disque de secours distribué devient partie intégrante de la baie. Le disque logique reste au niveau RAID 5E. Après avoir remplacé un disque défaillant par un nouveau, les données lecteur logique se dérouler dans l'état initial Schémas de distribution de disque dur. Lors de l'utilisation d'un disque logique RAID 5E dans des conceptions de cluster de basculement, il ne remplira pas ses fonctions pendant la compression/décompression des données.

Avantages :

  • haute sécurité des données ;
  • L'utilisation de la capacité utilisable est supérieure à RAID 1 ou RAID 1E ;
  • les performances sont meilleures que RAID 5.

Défauts:

  • les performances sont inférieures à celles du RAID 1E ;
  • ne peut pas partager le disque de rechange avec d'autres baies.

RAID5EE

Remarque : Non pris en charge sur tous les contrôleurs. Le niveau RAID 5EE est similaire au RAID-5E, mais avec une utilisation plus efficace du disque de rechange et un temps de récupération plus court. Semblable au niveau RAID 5E, ce niveau de matrice RAID crée des lignes de données et des sommes de contrôle sur tous les disques de la matrice. RAID-5EE offre une sécurité et des performances améliorées. Lors de l'utilisation du niveau RAID 5E, la capacité d'un volume logique est limitée à la capacité de deux disques durs physiques de la matrice (un pour le contrôle, un pour la sauvegarde). Le disque de rechange fait partie d'une matrice RAID de niveau 5EE. Cependant, contrairement au niveau RAID 5E, qui utilise de l'espace libre non partitionné comme réserve, le niveau RAID 5EE insère des blocs de somme de contrôle dans le disque de rechange, comme le montre l'exemple suivant. Cela vous permet de reconstruire les données plus rapidement en cas de panne d'un disque physique. Avec cette configuration, vous ne pourrez pas l'utiliser avec d'autres baies. Si vous avez besoin d'un disque de rechange pour une autre baie, vous devez disposer d'un autre disque dur de rechange. Le niveau RAID 5E nécessite un minimum de quatre disques et, selon le niveau du micrologiciel et leur capacité, prend en charge de 8 à 16 disques. Le niveau RAID 5E possède un micrologiciel spécifique. Remarque : Pour le niveau RAID 5EE, vous ne pouvez utiliser qu'un seul volume logique dans la matrice.

Avantages :

  • Protection des données à 100 %
  • Grande capacité de disque physique par rapport au RAID-1 ou RAID-1E
  • Performances supérieures par rapport au RAID-5
  • Récupération RAID plus rapide par rapport au RAID-5E

Défauts:

  • Performances inférieures à RAID-1 ou RAID-1E
  • Prend en charge un seul volume logique par baie
  • Impossibilité de partager un disque de rechange avec d'autres baies
  • Tous les contrôleurs ne sont pas pris en charge

RAID6

RAID 6 - similaire au RAID 5, mais en a plus haut degré fiabilité - la capacité de 2 disques est allouée aux sommes de contrôle, 2 sommes sont calculées à l'aide d'algorithmes différents. Nécessite un contrôleur RAID plus puissant. Assure le fonctionnement après la panne simultanée de deux disques - protection contre les pannes multiples. Un minimum de 4 disques sont requis pour organiser la baie. En règle générale, l'utilisation de RAID-6 entraîne une baisse d'environ 10 à 15 % des performances du groupe de disques par rapport aux performances similaires de RAID-5, ce qui est dû à la grande quantité de traitement pour le contrôleur (la nécessité de calculer une deuxième somme de contrôle, ainsi que lire et réécrire plus de blocs de disque lors de l'écriture de chaque bloc).

RAID7

RAID 7 est une marque déposée de Storage Computer Corporation. niveau séparé Le RAID ne l'est pas. La structure du tableau est la suivante : les données sont stockées sur des disques, un disque est utilisé pour stocker les blocs de parité. L'écriture sur les disques est mise en cache à l'aide mémoire vive, la baie elle-même nécessite un UPS obligatoire ; En cas de panne de courant, les données sont corrompues.

RAID 10 ou RAID 1+0 (très haute fiabilité avec hautes performances)

Une combinaison d'un raid miroir et d'un raid sur disque rayé. Dans ce type de raid, les disques sont combinés par paires dans des raids en miroir (RAID 1), puis toutes ces paires en miroir sont combinées dans un réseau entrelacé (RAID 0). Vous ne pouvez combiner qu'un nombre pair de disques dans un raid, le minimum est de 4, le maximum est de 16. Nous héritons de la fiabilité du RAID 1 et de la vitesse du RAID 0.

Avantages – tolérance aux pannes et performances élevées

Inconvénients – coût élevé

RAID 50 ou RAID 5+0 (taux d'E/S élevés et performances de transfert de données)

Également connu sous le nom de RAID 50, il s'agit d'une combinaison de RAID 5 et RAID 0. La matrice allie hautes performances et tolérance aux pannes.

Avantages – tolérance aux pannes élevée, vitesse de transfert de données et exécution des requêtes

Inconvénients – coût élevé

RAID60

Une matrice RAID de niveau 60 combine les caractéristiques des niveaux 6 et 0. Une matrice RAID 60 combine le striping direct au niveau bloc du RAID 0 avec le striping à double parité du RAID 6, à savoir : le RAID 0 est réparti entre les éléments du RAID 6. RAID60 disque virtuel Peut survivre à la perte de deux disques durs dans chaque configuration RAID 6 sans perdre de données. Il est plus efficace avec les données, une grande fiabilité est nécessaire, demande élevée taux élevés, transfert de données élevé et capacités moyennes à grandes. Le nombre minimum de disques est de 8.

RAID linéaire

Le RAID linéaire est une simple combinaison de disques qui crée un grand disque virtuel. En RAID linéaire, les blocs sont alloués d'abord sur un disque inclus dans la matrice, puis, si celui-ci est plein, sur un autre, etc. Une telle consolidation n'apporte aucun avantage en termes de performances, car les opérations d'E/S ne seront probablement pas réparties entre les disques. Le RAID linéaire manque également de redondance et augmente en fait le risque de panne : si un seul disque tombe en panne, la matrice entière tombera en panne. La capacité de la baie est égale à la capacité totale de tous les disques.

La principale conclusion que l'on peut tirer est que chaque niveau de raid a ses propres avantages et inconvénients.

Une conclusion encore plus importante est qu’un raid ne garantit pas l’intégrité de vos données. Autrement dit, si quelqu'un supprime un fichier ou s'il est endommagé par un processus, le raid ne nous aidera pas. Par conséquent, le raid ne nous libère pas de la nécessité de faire des sauvegardes. Mais cela aide lorsque des problèmes surviennent avec les disques au niveau physique.

© Andrey Egorov, 2005, 2006. Groupe de sociétés TIM.

Les visiteurs du forum nous posent la question : « Quel niveau RAID est le plus fiable ? Tout le monde sait que le niveau le plus courant est le RAID5, mais il n'est pas sans inconvénients sérieux qui ne sont pas évidents pour les non-spécialistes.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 ou que sont les niveaux RAID ?

Dans cet article, je vais essayer de caractériser les niveaux RAID les plus populaires, puis de formuler des recommandations pour l'utilisation de ces niveaux. Pour illustrer l'article, j'ai créé un diagramme dans lequel j'ai placé ces niveaux dans l'espace tridimensionnel de la fiabilité, des performances et de la rentabilité.

JBOD(Just a Bunch of Disks) est une simple répartition de disques durs, qui n'est pas formellement un niveau RAID. Un volume JBOD peut être une matrice d'un seul disque ou une agrégation de plusieurs disques. Le contrôleur RAID n'a besoin d'effectuer aucun calcul pour faire fonctionner un tel volume. Dans notre diagramme, le disque JBOD sert de point de départ « unique » : sa fiabilité, ses performances et ses valeurs de coût sont les mêmes que celles d'un seul disque dur.

RAID0(« Striping ») n'a pas de redondance et distribue les informations immédiatement sur tous les disques inclus dans la matrice sous forme de petits blocs (« stripes »). De ce fait, les performances augmentent considérablement, mais la fiabilité en souffre. Comme avec JBOD, nous obtenons 100 % de la capacité disque pour notre argent.

Laissez-moi vous expliquer pourquoi la fiabilité du stockage des données sur n'importe quel volume composite diminue - car si l'un des disques durs qui y sont inclus tombe en panne, toutes les informations sont complètement et irrémédiablement perdues. Conformément à la théorie des probabilités, mathématiquement, la fiabilité d'un volume RAID0 est égale au produit des fiabilités de ses disques constitutifs, dont chacun est inférieur à un, de sorte que la fiabilité totale est évidemment inférieure à la fiabilité de n'importe quel disque.

Bon niveau - RAID1(«Miroir», «miroir»). Il dispose d'une protection contre la panne de la moitié du matériel disponible (dans le cas général, l'un des deux disques durs), offre une vitesse d'écriture acceptable et des gains en vitesse de lecture grâce à la parallélisation des requêtes. L’inconvénient est que vous devez payer le coût de deux disques durs pour obtenir la capacité utilisable d’un seul disque dur.

Au départ, on suppose que le disque dur est un objet fiable. En conséquence, la probabilité de défaillance de deux disques à la fois est égale (selon la formule) au produit des probabilités, c'est-à-dire des ordres de grandeur inférieurs ! Malheureusement, vrai vie- pas une théorie ! Deux disques durs sont extraits du même lot et fonctionnent dans les mêmes conditions, et si l'un des disques tombe en panne, la charge sur le reste augmente, donc en pratique, si l'un des disques tombe en panne, des mesures urgentes doivent être prises pour restaurer redondance. Pour ce faire, il est recommandé d'utiliser des disques de secours avec n'importe quel niveau RAID (sauf zéro) HotSpare. L'avantage de cette approche est de maintenir une fiabilité constante. L'inconvénient réside dans des coûts encore plus élevés (c'est-à-dire le coût de 3 disques durs pour stocker le volume d'un disque).

Le miroir sur de nombreux disques est un niveau RAID10. Lors de l'utilisation de ce niveau, des paires de disques en miroir sont disposées en « chaîne », de sorte que le volume résultant peut dépasser la capacité d'un seul disque dur. Les avantages et inconvénients sont les mêmes que pour le niveau RAID1. Comme dans d'autres cas, il est recommandé d'inclure des disques de secours HotSpare dans la baie à raison d'un disque de rechange pour cinq travailleurs.

RAID5, en effet, le niveau le plus populaire - principalement en raison de son efficacité. En sacrifiant la capacité d’un seul disque de la baie pour la redondance, nous obtenons une protection contre la panne de l’un des disques durs du volume. L'écriture d'informations sur un volume RAID5 nécessite des ressources supplémentaires, car des calculs supplémentaires sont nécessaires, mais lors de la lecture (par rapport à un disque dur séparé), il y a un gain, car les flux de données de plusieurs disques durs sont parallélisés.

Les inconvénients de RAID5 apparaissent lorsque l'un des disques tombe en panne : tout le volume passe en mode critique, toutes les opérations d'écriture et de lecture s'accompagnent de manipulations supplémentaires, les performances chutent fortement et les disques commencent à chauffer. Si aucune mesure immédiate n’est prise, vous risquez de perdre la totalité du volume. Par conséquent (voir ci-dessus), vous devez absolument utiliser un disque Hot Spare avec un volume RAID5.

En plus des niveaux de base RAID0 - RAID5 décrits dans la norme, il existe des niveaux combinés RAID10, RAID30, RAID50, RAID15, qui divers fabricants Chacun l'interprète différemment.

L'essence de telles combinaisons est brièvement la suivante. RAID10 est une combinaison de un et zéro (voir ci-dessus). RAID50 est une combinaison de volumes « 0 » de niveau 5. RAID15 est un « miroir » des « cinq ». Et ainsi de suite.

Ainsi, les niveaux combinés héritent des avantages (et des inconvénients) de leurs « parents ». Ainsi, l'apparition d'un « zéro » dans le niveau RAID50 n'y ajoute aucune fiabilité, mais a un effet positif sur les performances. Niveau RAID15, probablement très fiable, mais ce n'est pas le plus rapide et, de plus, extrêmement peu économique (la capacité utile du volume est inférieure à la moitié de la taille de la baie de disques d'origine).

RAID6 diffère du RAID 5 en ce que dans chaque ligne de données (en anglais Bande) n’en a pas, mais deux bloc de somme de contrôle. Les sommes de contrôle sont « multidimensionnelles », c'est-à-dire : indépendants l'un de l'autre, de sorte que même la panne de deux disques de la matrice vous permet de sauvegarder les données d'origine. Le calcul des sommes de contrôle à l'aide de la méthode Reed-Solomon nécessite des calculs plus intensifs par rapport à RAID5, donc auparavant, le sixième niveau n'était pratiquement pas utilisé. Aujourd'hui, de nombreux produits le soutiennent, depuis qu'ils ont commencé à installer des microcircuits spécialisés qui effectuent toutes les opérations mathématiques nécessaires.

Selon certaines études, la restauration de l'intégrité après une panne d'un seul disque sur un volume RAID5 composé de Disques SATA gros volume (400 et 500 gigaoctets), dans 5% des cas cela se termine par une perte de données. Autrement dit, dans un cas sur vingt, lors de la régénération d'une matrice RAID5 vers un disque Hot Spare, le deuxième disque peut tomber en panne... D'où les recommandations des meilleurs disques RAID : 1) Toujours faire des sauvegardes ; 2) utiliser RAID6!

Récemment, de nouveaux niveaux RAID1E, RAID5E, RAID5EE sont apparus. La lettre « E » dans le nom signifie Amélioré.

RAID niveau 1 amélioré (RAID niveau 1E) combine la mise en miroir et la répartition des données. Ce mélange des niveaux 0 et 1 s'agence de la façon suivante. Les données d'une ligne sont distribuées exactement comme dans RAID 0. Autrement dit, la ligne de données n'a pas de redondance. La rangée suivante de blocs de données copie la précédente avec un décalage d'un bloc. Ainsi, comme en mode RAID 1 standard, chaque bloc de données possède une copie miroir sur l'un des disques, le volume utile de la matrice est donc égal à la moitié du volume total des disques durs inclus dans la matrice. RAID 1E nécessite une combinaison de trois disques ou plus pour fonctionner.

J'aime beaucoup le niveau RAID1E. Pour une station de travail graphique puissante ou même pour ordinateur de famillechoix optimal! Il présente tous les avantages des niveaux zéro et premier : une excellente vitesse et une grande fiabilité.

Passons maintenant au niveau RAID niveau 5 amélioré (RAID niveau 5E). C'est la même chose que RAID5, uniquement avec un disque de sauvegarde intégré à la matrice. disque de rechange. Cette intégration s'effectue de la manière suivante : sur tous les disques de la baie, une partie 1/N de l'espace est laissée libre, qui sert de hot spare en cas de panne d'un des disques. Pour cette raison, RAID5E démontre, outre la fiabilité, meilleure performance, puisque la lecture/écriture s'effectue en parallèle avec plus grand nombre disques en même temps et le disque de rechange n'est pas inactif, comme en RAID5. Évidemment, le disque de sauvegarde inclus dans le volume ne peut pas être partagé avec d'autres volumes (dédié ou partagé). Un volume RAID 5E est construit sur au moins quatre disques physiques. Le volume utile d'un volume logique est calculé à l'aide de la formule N-2.

RAID niveau 5E amélioré (RAID niveau 5EE) similaire au niveau RAID 5E, mais il dispose d'une allocation de disques de rechange plus efficace et, par conséquent, de plus de temps rapide récupération. Comme le niveau RAID5E, ce niveau RAID distribue les blocs de données et les sommes de contrôle en lignes. Mais il distribue également des blocs gratuits du disque de rechange, et ne réserve pas simplement une partie de l'espace disque à ces fins. Cela réduit le temps nécessaire pour reconstruire l'intégrité d'un volume RAID5EE. Le disque de sauvegarde inclus dans le volume ne peut pas être partagé avec d'autres volumes - comme dans le cas précédent. Un volume RAID 5EE est construit sur un minimum de quatre disques physiques. Le volume utile d'un volume logique est calculé à l'aide de la formule N-2.

Bizarrement, aucune mention de niveau RAID6E Je ne l'ai pas trouvé sur Internet - jusqu'à présent, ce niveau n'est proposé ni même annoncé par aucun fabricant. Mais le niveau RAID6E (ou RAID6EE ?) peut être proposé selon le même principe que le précédent. Disque HotSpare Nécessairement doit accompagner tout volume RAID, y compris RAID 6. Bien sûr, nous ne perdrons pas d'informations en cas de panne d'un ou deux disques, mais il est extrêmement important de commencer à régénérer l'intégrité de la matrice le plus tôt possible afin de faire sortir rapidement le système. du mode « critique ». Puisque la nécessité d'un disque Hot Spare ne fait aucun doute pour nous, il serait logique d'aller plus loin et de le « répartir » sur le volume comme cela se fait en RAID 5EE afin de bénéficier des avantages de l'utilisation d'un plus grand nombre de disques ( meilleure vitesse en lecture-écriture et restauration plus rapide de l'intégrité).

Niveaux de RAID en « chiffres ».

J'en ai rassemblé quelques-uns dans un tableau paramètres importants presque tous les niveaux RAID, afin que vous puissiez les comparer entre eux et mieux comprendre leur essence.

Niveau
~~~~~~~

Cabanes-
exactement
ness
~~~~~~~

Utiliser
Capacité du disque
~~~~~~~

Production
ditel-
ness
en lisant

~~~~~~~

Production
ditel-
ness
enregistrements

~~~~~~~

Intégré
disque
réserve

~~~~~~~

Min. nombre de disques
~~~~~~~

Max. nombre de disques

~~~~~~~

Exc.

Exc.

Exc.

Exc.

Tous les niveaux « miroir » sont RAID 1, 1+0, 10, 1E, 1E0.

Essayons à nouveau de bien comprendre en quoi ces niveaux diffèrent ?

RAID1.
Il s’agit d’un « miroir » classique. Deux (et seulement deux !) disques durs fonctionnent comme un seul, étant une copie complète l'un de l'autre. La panne de l'un ou l'autre de ces deux disques n'entraîne pas de perte de vos données, car le contrôleur continue de fonctionner sur le disque restant. RAID1 en chiffres : 2x redondance, 2x fiabilité, 2x coût. Les performances d'écriture sont équivalentes à celles d'un seul disque dur. Les performances de lecture sont plus élevées car le contrôleur peut répartir les opérations de lecture entre deux disques.

RAID10.
L'essence de ce niveau est que les disques de la matrice sont combinés par paires en « miroirs » (RAID 1), puis toutes ces paires de miroirs, à leur tour, sont combinées en une matrice entrelacée commune (RAID 0). C'est pourquoi on l'appelle parfois RAID1+0. Un point important est qu'en RAID 10, vous ne pouvez combiner qu'un nombre pair de disques (minimum 4, maximum 16). Avantages : la fiabilité est héritée du « miroir », les performances en lecture et en écriture sont héritées du « zéro ».

RAID1E.
La lettre « E » dans le nom signifie « Amélioré », c'est-à-dire "amélioré". Le principe de cette amélioration est le suivant : les données sont « supprimées » par blocs sur tous les disques de la baie, puis « supprimées » à nouveau avec un décalage sur un disque. RAID 1E peut combiner de trois à 16 disques. La fiabilité correspond aux « dix » indicateurs, et les performances deviennent un peu meilleures grâce à une plus grande « alternance ».

RAID1E0.
Ce niveau est implémenté comme ceci : nous créons une matrice « nulle » à partir des matrices RAID1E. Le nombre total de disques doit donc être un multiple de trois : un minimum de trois et un maximum de soixante ! Dans ce cas, il est peu probable que nous obtenions un avantage en termes de vitesse et la complexité de la mise en œuvre peut nuire à la fiabilité. Le principal avantage est la possibilité de combiner un très grand nombre (jusqu'à 60) de disques en une seule baie.

La similitude de tous les niveaux RAID 1X réside dans leurs indicateurs de redondance : par souci de fiabilité, exactement 50 % de la capacité totale des disques de la matrice est sacrifiée.