Co to jest macierz RAID? Jakie awarie spotykają macierze RAID?
- RAID Recovery Lab
- Wiedza
Macierz to zestaw połączonych ze sobą i współpracujących dysków, widocznych w systemie jako pojedynczy dysk logiczny. Jednak połączenie tych dysków nie jest przypadkowe. Dyski te zarządzane są przez specjalny wielokanałowy kontroler, a zapis i odczyt danych zależy od poziomu i złożoności systemu.
W skrócie macierze nazywane są RAIDem - Redundant Array of Independent Disks – (nadmiarowa macierz niezależnych dysków), a oznaczenie liczbowe oznacza jej złożoność.. Minimalnie RAID składa się z dwóch dysków (RAID 0 lub RAID1).
Macierze służą do składowania danych i mają za zadnie zapewnić szybki i bezpośredni do nich dostęp, zapewniając jednocześnie wysoki poziom bezpieczeństwa informacji w czasie rzeczywistym. Dzisiejsze macierze mają coraz więcej możliwości konfigurowania i zarządzania rozbudowanymi systemami dysków oraz ich monitorowania, również online.
Systemy zarządzania pozwalają na zdalną konfigurację oraz zapobieganie awariom poprzez informowanie z dużym wyprzedzeniem o możliwości uszkodzenia pojedynczego dysku dzięki systemowi SMART . Administrator ma wówczas możliwość zareagowania w odpowiednim czasie. Bezpieczeństwo RAIDu to również nadmiarowość, która ma uodpornić system na awarię jednego lub kilku dysków.
Użytkownicy często uważają RAID jako swego roszaju backup ze względu na tą właśnie nadmiarowość (jeden dysk zabezpiecza dane przed awarią). Jednak właśnie ze względu na tą cechę, trzeba brać pod uwagę, że jest to tylko i wyłącznie zabezpieczenie przed awarią jednego nośnika. W przypadku wspomnianej awarii, można taki dysk wymienić bez konieczności wyłączania całego systemu. Kontroler RAID samoczynnie odbuduje wtedy strukturę danych na nowym dysku używając do tego danych technicznych i metadanych z pozostałych dysków.
Jednak co się stanie kiedy jeden dysk uszkodzi się całkowicie, a pozostałe będą w bardzo słabym stanie?. Wówczas odbudowa macierzy może być niemożliwa.
A co się stanie, jeżeli dane zostaną uszkodzone, zmanipulowane lub zaszyfrowane przez złośliwe oprogramowanie. Czy dane dadzą się odtworzyć? Oczywiście, że nie.
A co będzie jeżeli powstanie przepięcie elektryczne i uszkodzeniu ulegnie kilka dysków, albo cała macierz. Czy będzie dostęp do danych? Nie.
Co będzie jak lekkomyślnie ktoś dołoży dodatkowe dyski do macierzy lub zmieni konfigurację, nie do końca wiedząc, jak macierz zostanie przebudowana i w jakim czasie? Wówczas najmniejsza awaria spowoduje brak dostępu do danych.
Łatwo więc, wywnioskować z powyższego, że RAID nie jest tak naprawdę backupem danych. Backupem musi być dodatkowy nośnik, na który kopiuje się dane w odpowiednim czasie i można w każdej chwili do nich wrócić.
Oczywiście nieraz byliśmy proszeni o odzyskiwanie danych z RAID w różnej konfiguracji i nie zawsze były to problemy techniczne, ale często też błędy ludzkie, które uniemożliwiły informatykom odtworzenie danych z RAID.
Jeszcze raz zaznaczę, że RAID został zaprojektowany do szybkiego i niezakłóconego dostępu do danych, dodając pewne funkcje zabezpieczeń w przypadku awarii nośnika. Nie został natomiast zaprojektowany jako backup.
Najczęstsze awarie, które mogą spowodować brak dostępu do danych:
- zaburzenie integralności zapisanych i odczytywanych danych
- uszkodzenie, skasowanie danych przez samego użytkownika
- awaria kontrolera RAID
- niesprawność większej ilości dysków niż przewiduje nadmiarowość danej konfiguracji
- uszkodzenie całej macierzy z powodu zdarzeń losowych (przepięcie, pożar, zalanie)
- uszkodzenie danych na jednym dysku powoduje ich wadliwą replikację
Odtworzenie danych ze złożonych macierzy jest czynnością trudną i złożoną , szczególnie jeśli połączonych jest kilka rozwiązań (np. RAID50 = RAID 5 + RAID 0). Operacja taka wymaga przeważnie najpierw odzyskiwania danych z poszczególnych dysków macierzy, utworzenie ich obrazów, a następnie poskładanie na podstawie metadanych z tych dysków, właściwej konfiguracji i kolejności RAIDu. Wtedy dopiero jest szansa, że dane będą widoczne dla użytkownika. Praca nad takim odzyskiem, jest bardzo złożona i trudna ze względu na skomplikowany algorytm kontrolera, dlatego zalecamy przede wszystkim tworzenie cyklicznych kopii zapasowych