Do naszego laboratorium, na odzyskanie danych, trafił serwer NAS Netgear ReadyData 5200 wykorzystywany jako centralne repozytorium danych w firmie produkcyjnej. Urządzenie było skonfigurowane w oparciu o macierz RAID 6 złożoną z 10 dysków Seagate Exos 3TB SAS o pojemności 3 TB każdy, z interfejsem SAS.
Macierz przechowywała około 18 TB danych produkcyjnych, projektowych oraz archiwalnych kopii systemów księgowych jednaj z firm z Pod Warszawy ( z Pruszkowa) . Według administratora system działał stabilnie przez kilka lat, bez aktualnej, odseparowanej kopii zapasowej, bo kopia robiła się na jednym z woluminów macierzy.
Objawy awarii
Klient zgłosił, że:
-
serwer przestał udostępniać zasoby sieciowe,
-
interfejs zarządzania NAS nie pozwalał na montowanie wolumenu,
-
system raportował degradację macierzy,
-
cztery dyski oznaczone były jako uszkodzone lub offline.
W RAID 6 dopuszczalna jest awaria maksymalnie dwóch dysków. W tym przypadku jednoczesna degradacja czterech nośników spowodowała całkowitą utratę dostępu do danych oraz brak możliwości automatycznej odbudowy.
Serwer posiadał jeszcze 2 dyski po 500GB w RAID 1 na których był zainstalowany system operacyjny z logami i konfiguracją.

Wstępna analiza techniczna
Po dostarczeniu sprzętu do laboratorium wykonano:
-
pełną dokumentację konfiguracji,
-
odczyt logów systemowych,
-
identyfikację fizycznych i logicznych parametrów dysków.
Dwa dyski wykazywały poważne uszkodzenia głowic i powierzchni talerzy i problemy z odczytem w obszarach serwisowych ( częsta usterka w dyskach SAS Seagate) . Kolejne dwa posiadały niestabilne sektory i liczne błędy UNC w obszarach danych.
Ze względu na przekroczenie tolerancji błędów dla RAID 6 oraz ryzyko dalszej degradacji, wykluczono jakiekolwiek próby uruchamiania macierzy w środowisku produkcyjnym.
Etap 1. Wykonanie kopii posektorowych
8 dysków zostało podłączonych do systemu PC-3000 firmy ACE Laboratory w celu wykonania kopii posektorowych.
Celem było:
-
wykonanie pełnych kopii posektorowych,
-
praca wyłącznie na obrazach dysków,
-
minimalizacja ryzyka pogłębienia uszkodzeń mechanicznych.
W przypadku dwóch najbardziej uszkodzonych nośników zastosowano:
-
wieloetapowe odczyty z pomijaniem niestabilnych sektorów,
-
strategię odczytu od końca dysku,
-
rekonstrukcję fragmentów danych z obszarów częściowo czytelnych.
Uzyskano komplet obrazów z różnym stopniem nieczytelnych sektorów, jednak w granicach pozwalających na próbę rekonstrukcji RAID 6.
Etap 2. Analiza struktury RAID
Kolejnym krokiem była analiza parametrów macierzy:
-
kolejności dysków,
-
rozmiaru stripe,
-
offsetu danych,
-
algorytmu rotacji parzystości.
W systemach ReadyNAS konfiguracja RAID często zawiera niestandardowe przesunięcia logiczne oraz dodatkowe warstwy LVM. Analiza metadanych pozwoliła ustalić poprawną strukturę logiczną macierzy.
W RAID 6 stosowane są dwa niezależne bloki parzystości. Teoretycznie pozwala to na utratę dwóch dysków. W tej sytuacji cztery nośniki zawierały błędy, jednak nie wszystkie sektory były całkowicie nieczytelne. Kluczowe było:
-
zidentyfikowanie sektorów krytycznych dla spójności danych,
-
określenie, które bloki można odtworzyć z parzystości,
-
ustalenie zakresu faktycznie utraconych danych.

Etap 3. Rekonstrukcja macierzy RAID 6
Rekonstrukcję przeprowadzono w środowisku PC-3000 na podstawie kopii posektorowych.
Proces obejmował:
-
wirtualne złożenie macierzy RAID 6,
-
symulację brakujących bloków danych,
-
wykorzystanie podwójnej parzystości do odtworzenia utraconych fragmentów.
- Analizę struktury plików i spójności danych.
Dzięki temu możliwe było logiczne odbudowanie struktury wolumenu oraz systemu plików w macierzy RAID
W miejscach, gdzie trzy lub cztery dyski zawierały nieczytelne sektory w obrębie tego samego stripe, wystąpiły lokalne uszkodzenia plików. Jednak dzięki rozproszeniu błędów nie miały one charakteru krytycznego dla całego wolumenu.
Etap 4. Weryfikacja i odzyskanie danych
Po zrekonstruowaniu macierzy wykonano:
-
analizę integralności systemu plików,
-
rekonstrukcję struktury katalogów,
-
testowe sprawdzenie nagłówków kluczowych baz danych i archiwów.
W tym przypadku odzyskaliśmy ponad 99 procent danych użytkownika. Niewielka część plików archiwalnych zawierała uszkodzone fragmenty wynikające z nakładających się błędów sektorowych w kilku dyskach w tych samych obszarach stripe.
Dane zostały przekazane klientowi na nowej macierzy dyskowej oraz dodatkowym nośniku zapasowym.
Przyczyna awarii
Analiza wykazała, że:
-
dyski pracowały ponad 12 lat w trybie 24/7,
-
nie były wymieniane prewencyjnie,
-
brakowało regularnych testów SMART i kontroli błędów,
-
nie istniała aktualna kopia zapasowa poza macierzą RAID.
Najprawdopodobniej doszło do kaskadowej degradacji nośników, w której kolejne dyski ulegały awarii jeden po drugim, co jest często spotykane przy długotrwałym użytkowaniu takich systemów.
Wnioski
-
RAID 6 nie jest kopią zapasową
Macierz zapewnia odporność na awarię dwóch dysków, ale nie chroni przed wielokrotną degradacją, błędami logicznymi ani uszkodzeniami kontrolera. -
Im większa liczba dysków, tym większe ryzyko statystyczne
W konfiguracji 10 × 3 TB prawdopodobieństwo wystąpienia błędów odczytu podczas odbudowy znacząco rośnie. -
Praca wyłącznie na kopiach posektorowych jest kluczowa
Bez wykonania obrazów dysków próby odbudowy w oryginalnym NAS mogłyby doprowadzić do dalszych uszkodzeń lub trwałej utraty danych. -
Profesjonalne narzędzia klasy PC-3000 umożliwiają rekonstrukcję nawet przy przekroczonej tolerancji RAID 6
W tym przypadku kluczowe było wykorzystanie podwójnej parzystości oraz częściowo czytelnych sektorów z czterech uszkodzonych nośników.
Podsumowanie
Odzyskanie danych z macierzy RAID 6 w serwerze Netgear ReadyNAS 5200 z czterema zdegradowanymi dyskami było możliwe dzięki:
-
pełnej analizie fizycznego stanu nośników,
-
wykonaniu kopii posektorowych wszystkich dysków,
-
specjalistycznej rekonstrukcji RAID w środowisku PC-3000.
Przypadek ten pokazuje, że nawet przekroczenie nominalnej odporności RAID 6 nie oznacza automatycznie bezpowrotnej utraty danych, pod warunkiem zastosowania właściwej procedury laboratoryjnej i profesjonalnych narzędzi. Nasze laboratorium posiada możliwości techniczne do odzyskiwania danych ze wszystkich rodzajów macierzy, niezależnie od konfiguracji i wielkości.
Zapraszamy na bezpłatną wycenę.