Do naszego laboratorium, na odzyskanie danych,  trafił serwer NAS Netgear ReadyData 5200 wykorzystywany jako centralne repozytorium danych w firmie produkcyjnej. Urządzenie było skonfigurowane w oparciu o macierz RAID 6 złożoną z 10 dysków Seagate Exos 3TB SAS o pojemności 3 TB każdy, z interfejsem SAS.

Macierz przechowywała około 18 TB danych produkcyjnych, projektowych oraz archiwalnych kopii systemów księgowych jednaj z firm z Pod Warszawy ( z Pruszkowa) . Według administratora system działał stabilnie przez kilka lat, bez aktualnej, odseparowanej kopii zapasowej, bo kopia robiła się na jednym z woluminów macierzy.

Objawy awarii

Klient zgłosił, że:

  • serwer przestał udostępniać zasoby sieciowe,

  • interfejs zarządzania NAS nie pozwalał na montowanie wolumenu,

  • system raportował degradację macierzy,

  • cztery dyski oznaczone były jako uszkodzone lub offline.

W RAID 6 dopuszczalna jest awaria maksymalnie dwóch dysków. W tym przypadku jednoczesna degradacja czterech nośników spowodowała całkowitą utratę dostępu do danych oraz brak możliwości automatycznej odbudowy.

Serwer posiadał jeszcze 2 dyski po 500GB w RAID 1 na których był zainstalowany system operacyjny z logami i konfiguracją.

10 dysków Seagate 3TB SAS w macierzy RAID 6

Wstępna analiza techniczna

Po dostarczeniu sprzętu do laboratorium wykonano:

  • pełną dokumentację konfiguracji,

  • odczyt logów systemowych,

  • identyfikację fizycznych i logicznych parametrów dysków.

Dwa dyski wykazywały poważne uszkodzenia głowic i powierzchni talerzy i problemy z odczytem w obszarach serwisowych ( częsta usterka w dyskach SAS Seagate) . Kolejne dwa posiadały niestabilne sektory i liczne błędy UNC w obszarach danych.

Ze względu na przekroczenie tolerancji błędów dla RAID 6 oraz ryzyko dalszej degradacji, wykluczono jakiekolwiek próby uruchamiania macierzy w środowisku produkcyjnym.

Etap 1. Wykonanie kopii posektorowych

8 dysków zostało podłączonych do systemu PC-3000 firmy ACE Laboratory w celu wykonania kopii posektorowych.

Celem było:

  • wykonanie pełnych kopii posektorowych,

  • praca wyłącznie na obrazach dysków,

  • minimalizacja ryzyka pogłębienia uszkodzeń mechanicznych.

W przypadku dwóch najbardziej uszkodzonych nośników zastosowano:

  • wieloetapowe odczyty z pomijaniem niestabilnych sektorów,

  • strategię odczytu od końca dysku,

  • rekonstrukcję fragmentów danych z obszarów częściowo czytelnych.

Uzyskano komplet obrazów z różnym stopniem nieczytelnych sektorów, jednak w granicach pozwalających na próbę rekonstrukcji RAID 6.

Etap 2. Analiza struktury RAID

Kolejnym krokiem była analiza parametrów macierzy:

  • kolejności dysków,

  • rozmiaru stripe,

  • offsetu danych,

  • algorytmu rotacji parzystości.

W systemach ReadyNAS konfiguracja RAID często zawiera niestandardowe przesunięcia logiczne oraz dodatkowe warstwy LVM. Analiza metadanych pozwoliła ustalić poprawną strukturę logiczną macierzy.

W RAID 6 stosowane są dwa niezależne bloki parzystości. Teoretycznie pozwala to na utratę dwóch dysków. W tej sytuacji cztery nośniki zawierały błędy, jednak nie wszystkie sektory były całkowicie nieczytelne. Kluczowe było:

  • zidentyfikowanie sektorów krytycznych dla spójności danych,

  • określenie, które bloki można odtworzyć z parzystości,

  • ustalenie zakresu faktycznie utraconych danych.

odzysk danych z RAID 6 Warszawa

Etap 3. Rekonstrukcja macierzy RAID 6

Rekonstrukcję przeprowadzono w środowisku PC-3000 na podstawie kopii posektorowych.

Proces obejmował:

  • wirtualne złożenie macierzy RAID 6,

  • symulację brakujących bloków danych,

  • wykorzystanie podwójnej parzystości do odtworzenia utraconych fragmentów.

  • Analizę struktury plików i spójności danych.

Dzięki temu możliwe było logiczne odbudowanie struktury wolumenu oraz systemu plików w macierzy RAID

W miejscach, gdzie trzy lub cztery dyski zawierały nieczytelne sektory w obrębie tego samego stripe, wystąpiły lokalne uszkodzenia plików. Jednak dzięki rozproszeniu błędów nie miały one charakteru krytycznego dla całego wolumenu.

Etap 4. Weryfikacja i odzyskanie danych

Po zrekonstruowaniu macierzy wykonano:

  • analizę integralności systemu plików,

  • rekonstrukcję struktury katalogów,

  • testowe sprawdzenie nagłówków kluczowych baz danych i archiwów.

W tym przypadku odzyskaliśmy ponad 99 procent danych użytkownika. Niewielka część plików archiwalnych zawierała uszkodzone fragmenty wynikające z nakładających się błędów sektorowych w kilku dyskach w tych samych obszarach stripe.

Dane zostały przekazane klientowi na nowej macierzy dyskowej oraz dodatkowym nośniku zapasowym.

Przyczyna awarii

Analiza wykazała, że:

  • dyski pracowały ponad 12 lat w trybie 24/7,

  • nie były wymieniane prewencyjnie,

  • brakowało regularnych testów SMART i kontroli błędów,

  • nie istniała aktualna kopia zapasowa poza macierzą RAID.

Najprawdopodobniej doszło do kaskadowej degradacji nośników, w której kolejne dyski ulegały awarii jeden po drugim, co jest często spotykane przy długotrwałym użytkowaniu takich systemów.

Wnioski

  1. RAID 6 nie jest kopią zapasową
    Macierz zapewnia odporność na awarię dwóch dysków, ale nie chroni przed wielokrotną degradacją, błędami logicznymi ani uszkodzeniami kontrolera.

  2. Im większa liczba dysków, tym większe ryzyko statystyczne
    W konfiguracji 10 × 3 TB prawdopodobieństwo wystąpienia błędów odczytu podczas odbudowy znacząco rośnie.

  3. Praca wyłącznie na kopiach posektorowych jest kluczowa
    Bez wykonania obrazów dysków próby odbudowy w oryginalnym NAS mogłyby doprowadzić do dalszych uszkodzeń lub trwałej utraty danych.

  4. Profesjonalne narzędzia klasy PC-3000 umożliwiają rekonstrukcję nawet przy przekroczonej tolerancji RAID 6
    W tym przypadku kluczowe było wykorzystanie podwójnej parzystości oraz częściowo czytelnych sektorów z czterech uszkodzonych nośników.

Podsumowanie

Odzyskanie danych z macierzy RAID 6 w serwerze Netgear ReadyNAS 5200 z czterema zdegradowanymi dyskami było możliwe dzięki:

  • pełnej analizie fizycznego stanu nośników,

  • wykonaniu kopii posektorowych wszystkich dysków,

  • specjalistycznej rekonstrukcji RAID w środowisku PC-3000.

Przypadek ten pokazuje, że nawet przekroczenie nominalnej odporności RAID 6 nie oznacza automatycznie bezpowrotnej utraty danych, pod warunkiem zastosowania właściwej procedury laboratoryjnej i profesjonalnych narzędzi. Nasze laboratorium posiada możliwości techniczne do odzyskiwania danych ze wszystkich rodzajów macierzy, niezależnie od konfiguracji i wielkości. 

Zapraszamy na bezpłatną wycenę.