RAID 5 vs RAID 6: quale è meglio e quando?

Diversi livelli RAID offrono diversi vantaggi. Alcuni forniscono miglioramenti delle prestazioni raggruppando la capacità di archiviazione e l’I/O di lettura/scrittura, mentre altri proteggono dai guasti hardware attraverso la ridondanza dei dati.

Tra questi livelli, RAID 5 e 6 sono stati due dei più popolari negli ultimi tempi, in quanto forniscono una combinazione di prestazioni e sicurezza. A causa delle loro varie somiglianze, può creare confusione capire quando è meglio usare RAID 5 vs RAID 6.

Pertanto, in questo articolo discuteremo cosa sono esattamente questi due livelli RAID , le loro principali somiglianze e differenze e quando utilizzare uno dei due.

Mostra tutti

Se volete continuare a leggere questo post su "[page_title]" cliccate sul pulsante "Mostra tutti" e potrete leggere il resto del contenuto gratuitamente. ebstomasborba.pt è un sito specializzato in Tecnologia, Notizie, Giochi e molti altri argomenti che potrebbero interessarvi. Se desiderate leggere altre informazioni simili a [page_title], continuate a navigare sul web e iscrivetevi alle notifiche del blog per non perdere le ultime novità.

Seguir leyendo

Sommario

Che cos’è RAID 5?

Come affermato, diversi livelli RAID si concentrano sulla protezione dei dati e sul miglioramento delle prestazioni a vari livelli. RAID 5 fornisce entrambi questi elementi tramite la parità distribuita interlacciata a blocchi.

Ciò significa che lo striping avviene a livello di blocco. La dimensione di questi blocchi, nota anche come dimensione del blocco, spetta all’utente impostarla, ma in genere varia da 64 KB a 1 MB.

Inoltre, per ogni striscia, viene scritto un blocco di dati di parità. Questi blocchi di parità sono distribuiti nell’array invece di essere archiviati su un disco di parità dedicato.

Tratteremo il motivo per cui RAID 5 gestisce la parità in questo modo più avanti nell’articolo, ma alla fine, ciò si traduce in uno spazio su disco riservato ai dati di parità.

Professionisti:

Tolleranza ai guasti contro il guasto di un singolo disco
Elevata capacità di archiviazione utilizzabile
Elevata velocità di lettura
Può essere configurato con un controller hardware o implementato tramite software

Contro:

Penalità sulle prestazioni di scrittura
Può gestire solo un errore del disco. Qualsiasi altro porta al fallimento dell’array
Processo di ricostruzione rischioso

Che cos’è RAID 6?

RAID 6 è molto simile a RAID 5, ma utilizza due blocchi di parità distribuiti su una striscia anziché uno. Questo dettaglio cambia tutto, dal livello di tolleranza agli errori fornito dall’array alle prestazioni e all’archiviazione utilizzabile.

Scrivere due volte la parità rende l’array molto più affidabile ma, per lo stesso motivo, anche le prestazioni di scrittura ne risentono del doppio. Le prestazioni in lettura, tuttavia, proprio come RAID 5, sono eccellenti.

Professionisti:

Tolleranza ai guasti contro due guasti del disco
Ottime prestazioni di lettura
La ricostruzione dopo un errore del disco è più sicura

Contro:

Maggiore sovraccarico delle prestazioni di scrittura
Due dischi di spazio necessario per la parità

RAID 5 Vs RAID 6 – Differenze principali

RAID 5 e 6 differiscono principalmente per il fatto che RAID 6 utilizza due blocchi di parità per striscia, mentre RAID 5 ne utilizza solo uno. Ma come affermato, questo porta anche a una serie di altre differenze, che tratteremo nelle sezioni seguenti.

Tolleranza ai guasti

La prima cosa che influisce sul conteggio dei blocchi di parità è il livello di tolleranza agli errori. In un array RAID 5, per ogni striscia viene scritto un blocco di dati di parità delle dimensioni di un blocco. In caso di errore del disco, i dati persi possono essere ricalcolati utilizzando i dati di parità ei dati sugli altri dischi nell’array.

Essenzialmente, ciò significa che un array RAID 5 può gestire un errore del disco senza alcuna perdita di dati. Di solito, comunque. Questa tolleranza ai guasti è stata la ragione per cui RAID 5 è stato molto popolare fino agli anni 2010. Al giorno d’oggi, tuttavia, RAID 5 viene utilizzato raramente poiché la sua affidabilità non è più all’altezza. Ciò è dovuto al modo in cui la maggior parte dei controller RAID hardware gestisce le ricostruzioni.

Se il controller rileva un errore di lettura irreversibile (URE) durante la ricostruzione, in genere contrassegnerà l’intero array come non riuscito per impedire un ulteriore danneggiamento dei dati. A meno che non si disponga di backup o si pianifichi di ripristinare i dati da singoli dischi, i dati vengono persi.

Le dimensioni degli HDD sono cresciute in modo esponenziale negli ultimi due decenni, ma i miglioramenti della velocità di lettura/scrittura sono stati molto più moderati. In sostanza, le dimensioni degli array sono aumentate a velocità molto maggiori rispetto alle velocità di trasferimento dei dati, il che significa che i tempi di ricostruzione hanno iniziato a diventare molto lunghi.

A seconda della configurazione, la ricostruzione dell’array dopo il guasto di un disco potrebbe richiedere da ore a giorni. Tali tempi di ricostruzione significavano una maggiore possibilità di incontrare URE durante la ricostruzione, il che si traduce in una maggiore possibilità di guasto dell’intero array.

Negli ultimi anni, i tassi di occorrenza di URE negli HDD sono diminuiti in modo significativo grazie ai miglioramenti tecnologici. Per questo motivo, RAID 5 è ancora utilizzato qua e là. Ma il consenso generale del settore è di optare ancora per RAID 6 o altri livelli, e per una buona ragione.

In RAID 6, i dati di parità vengono scritti due volte per stripe. Ciò significa che un array RAID 6 può sostenere fino a due guasti del disco senza perdita di dati. Ciò rende RAID 6 molto più affidabile e quindi più adatto per array più grandi con dati importanti.

Scrivi Prestazioni

Un array RAID 5 deve leggere i dati, calcolare la parità, scrivere i dati e quindi la parità. Per questo motivo, RAID 5 subisce una penalità sui carichi di lavoro che coinvolgono le scritture.

RAID 6 comporta il calcolo e la scrittura della parità due volte, il che è ottimo per l’affidabilità, ma significa anche che subisce il doppio dell’overhead per le operazioni di scrittura.

Per dimensioni di I/O inferiori (in genere 256 KB e inferiori), RAID 5 e 6 hanno prestazioni di scrittura molto simili. Ma con dimensioni I/O maggiori, RAID 5 è decisamente superiore.

Numero di dischi

RAID 5 richiede due dischi per lo striping e uno spazio su disco per memorizzare i dati di parità. Ciò significa che un array RAID 5 richiede almeno 3 unità disco.

RAID 6 è simile, ma richiede un minimo di 4 dischi perché i dati di parità occupano due dischi di spazio.

Archiviazione utilizzabile

In un array RAID 5, l’archiviazione utilizzabile può essere calcolata con (N – 1) x (dimensione del disco più piccola), dove N è il numero di unità disco. Ad esempio, abbiamo mostrato un array RAID 5 con tre dischi da 1 TB sotto. Uno spazio su disco viene utilizzato per archiviare i dati di parità e poiché la dimensione del disco più piccola è 1 TB, lo spazio utilizzabile arriva a 2 TB.

È importante provare a utilizzare dischi della stessa dimensione, altrimenti il disco più piccolo creerebbe un collo di bottiglia che si tradurrebbe in molto spazio inutilizzabile. L’esempio seguente mostra lo stesso scenario, in cui il disco da 500 GB ha reso inutilizzabili 1,5 TB.

In un array RAID 6, lo spazio di archiviazione utilizzabile viene calcolato con (N – 2) x (dimensione del disco più piccola). Ancora una volta, è importante utilizzare dischi della stessa dimensione per assicurarsi che non vi sia spazio inutilizzabile nell’array.

Calcolo della parità

In RAID 5, viene eseguita un’operazione XOR su ciascun byte di dati per calcolare le informazioni di parità in RAID 5. Ad esempio, supponiamo che il primo byte di dati in un array di 4 dischi sia simile a questo:

A1 – 11010101
A2 – 10001100
A3 – 10101100

Se eseguiamo un’operazione di XOR sulle prime due strisce (A1 e A2) e poi facciamo lo stesso con l’uscita e la terza striscia (A3), l’uscita è l’informazione di parità (Ap). In questo caso, il suo valore è 11110101.

Quando un disco qualsiasi (ad esempio, Disco 1) si guasta, ecco cosa succede. Innanzitutto, A2 XOR A3 ci fornisce l’output 00100000. Quando utilizziamo questo output in un’operazione XOR con Ap, otteniamo come risultato 11010101, ovvero i dati persi.

00100000
11110101
11010101

Questo è fondamentalmente il modo in cui i dati di parità vengono calcolati e utilizzati per ricalcolare i dati persi in RAID 5.

RAID 6 è molto più complesso in quanto calcola la parità due volte. A seconda della configurazione, questo viene implementato in vari modi, come il calcolo dei dati a doppio controllo (parità e Reed-Solomon), i dati di controllo a doppia parità ortogonale, la parità diagonale, ecc.

Controllore RAID

RAID 5 può essere implementato tramite mezzi hardware e software. Il primo prevede ovviamente l’utilizzo di un controller RAID hardware dedicato. Poiché RAID 5 richiede il calcolo della parità, questo è il percorso consigliato.

Ciò è particolarmente importante in alcuni casi, come con un NAS , in cui il processore non è abbastanza potente da gestire i calcoli senza creare un collo di bottiglia significativo.

Sebbene non sia l’ideale per motivi di prestazioni, RAID 5 può essere configurato anche utilizzando soluzioni software. Ad esempio, Windows ti consente di raggruppare i tuoi dischi utilizzando la funzione degli spazi di archiviazione. È inoltre possibile creare un volume RAID 5 tramite Gestione disco.

RAID 6, d’altra parte, richiede un controller RAID hardware. Questo perché i calcoli polinomiali eseguiti per calcolare il secondo livello di parità richiedono un notevole utilizzo del processore.

RAID 5 e RAID6 sono simili?

Dovrebbe essere evidente a questo punto che mentre RAID 5 e 6 hanno alcune differenze fondamentali, sono anche simili in molti modi. Per cominciare, a differenza di RAID 1, RAID 5 e 6 forniscono tolleranza agli errori attraverso la parità anziché il mirroring.

Nello specifico, usano la parità distribuita, che è diversa dai dischi di parità dedicati usati da RAID 2, 3 e 4. Con la parità distribuita, non devi preoccuparti dei colli di bottiglia come con un singolo disco di parità.

Sia RAID 5 che 6 hanno eccellenti prestazioni di lettura grazie allo striping dei dati. Ma per lo stesso motivo, entrambi soffrono anche di penalità sulle prestazioni di scrittura, anche se in misura diversa.

Cosa c’è di buono in RAID 5?

RAID 5 offre un buon mix di storage utilizzabile, protezione dei dati e prestazioni. Puoi anche configurarlo con meno dischi, il che lo rende un’opzione economica.

Se vuoi pensare in termini di prestazioni, RAID 5 è più adatto per i carichi di lavoro che comportano principalmente operazioni di lettura come i server di posta elettronica.

Per quanto riguarda la tolleranza ai guasti, abbiamo già spiegato come RAID 5 sia diventato meno affidabile nel corso degli anni. Va ancora bene per array di piccole dimensioni, ma con array più grandi, dove c’è una maggiore possibilità di ricostruzioni fallite, non consigliamo RAID 5.

Quando è migliore RAID 6?

L’affidabilità di RAID 6 va a scapito delle prestazioni di scrittura e dell’archiviazione utilizzabile. Tuttavia, questa leggera disparità vale senza dubbio la pena quando i dati sui dischi sono importanti.

RAID 6 non è il migliore per array più piccoli (ad esempio, 4 dischi), poiché una parte significativa dello storage viene persa a causa della ridondanza. Se è richiesta la ridondanza in piccoli array, RAID 5 o qualcosa come RAID 10 sarebbe meglio.

Invece, RAID 6 è più adatto per array più grandi dove c’è la possibilità di perdere molti più dati se la configurazione non è affidabile.

Verdetto finale: RAID 5 contro RAID 6

RAID 5 non è completamente inaffidabile ed è ancora utilizzabile per array più piccoli. Ma con dati davvero critici, vorrai dare la priorità alla protezione rispetto a piccole differenze di prestazioni, ed è qui che RAID 6 prende la torta.

Indipendentemente dal livello RAID scelto, tuttavia, è importante capire che RAID non è un backup. La ridondanza del RAID protegge solo dai guasti del disco. Anche un array RAID 6 può fallire durante le ricostruzioni.

Se i dati sui dischi sono abbastanza importanti da consentirti di utilizzare RAID 6 o altre versioni “affidabili”, non devi nemmeno prendere alla leggera i backup e le letture di pattugliamento. Infine, per ricapitolare, ecco le principali differenze tra RAID 5 e RAID 6:

	Raid 5	Raid 6
Strati di parità	I dati di parità vengono calcolati una volta.	I dati di parità vengono calcolati due volte.
Tolleranza ai guasti	Può tollerare un errore del disco.	Può tollerare due errori del disco.
Scrivi Prestazioni	Le prestazioni di scrittura subiscono qualche penalità.	Le prestazioni in scrittura soffrono di un sovraccarico relativamente maggiore.
Dischi minimi	Sono richiesti almeno 3 dischi.	Sono richiesti almeno 4 dischi.
Archiviazione utilizzabile	Offre maggiore spazio di archiviazione utilizzabile.	Lo spazio di archiviazione utilizzabile è relativamente inferiore.
Calcolo della parità	La parità viene calcolata attraverso una semplice operazione di XOR.	La parità viene calcolata utilizzando XOR insieme ad altri algoritmi complessi.
Implementazione	Può essere implementato utilizzando soluzioni hardware o software.	Richiede un controller RAID hardware dedicato.