Niedawno mieliśmy w naszym laboratorium bardzo nietypowy przypadek. Klient dostarczył macierz 6 dyskową, która nie dawała dostępu do danych. Wszystkie dyski to Seagate 10TB IronWolf ST1000VN004. Po długiej wstępnej analizie dysków z tego zlecenia, byliśmy bardzo zdziwieni. Wszystkie dyski macierzy miały zarejestrowane po kilkanaście tysięcy uderzeń i ponadnormatywnych wstrząsów.
Zastanawialiśmy się, co klient mógł robić z tą macierzą, że znalazła się ona w takim stanie. Oczywiście wszystkie dyski macierzy miały po kilkanaście błędów krytycznych, co uniemożliwiało dostęp do danych. Nie wiedzieliśmy na początku jak do tego zlecenia podejść. Na początku należało więc, Przeprowadzić wywiad z klientem. O dziwo, klient twierdził że macierz stoi w szafie serwerowej, do której nikt nie ma dostępu. Skąd więc, tyle zarejestrowanych uderzeń we wszystkich dyskach? Nie mieliśmy sensownego wytłumaczenia. No nic.. nieważne są przyczyny, ważne są efekty.
Wszystkie dyski musiały zostać poddane dogłębnej analizie, zrzucie obrazu, wykopiowania najważniejszych danych – obrazów dysków. Jeden z dysków macierzy był w fatalnym stanie . Na powierzchni jego talerzy było bardzo dużo uszkodzonych sektorów, bądź sektorów z opóźnionym czasem dostępu, więc zadanie wykopiowania obrazu było bardzo utrudnione.
Do wszystkich dysków macierzy trzeba było zastosować specjalną metodologię, gdyż dyski pochodziły z serii ST10000vn. które są nierozbieralne, ponieważ są fabrycznie zaspawane na stałe i wypełnione helem. Teoretycznie nie ma możliwości ich rozebrania, wymiany głowic, ani jakichkolwiek zabiegów w środku.
Trzeba więc, opierać się na tym, co można co robić metodą programową. Najlepszą metodą było kopiowanie sektor po sektorze z każdego dysku. Najciężej było z tym dyskiem który był najbardziej uszkodzony. Udało się szczęśliwie wykopiować większość danych, więc odzysk możemy uznać za sukces. Jednak zastanawialiśmy się z klientem i między sobą nad przyczyną awarii tej macierzy i uszkodzeń wszystkich dysków - skąd tyle zarejestrowanych uderzeń. To bardzo nietypowe w macierzy, a tym bardziej że macierz stała w zamkniętej szafie serwerowej. Nikt więc nie mógł mieć do niej dostępu fizycznego i uszkodzenia fizyczne nie powinny się zdarzyć.
A jednak. Po dogłębnej analizie najbardziej uszkodzonego dysku okazało się, że to on mógł mieć tak duże wibracje, że te właśnie, prawdopodobnie miały wpływ na pozostałe dyski macierzy. W związku z tym przy nałożeniu się w pewnych momentach wibracji wszystkich dysków zaczęły one rejestrować przeciążenia.
To zlecenie to był dla nas ciekawy i wyjątkowy temat. Udało się odzyskać wszystkie dane. Zawsze przestrzegaliśmy przed zabezpieczaniem danych w postaci konfiguracji macierzy. Nawet w teoretycznie najbezpieczniejszym zestawieniu (z dyskiem zapasowym HOT SPARE) może wystąpić niespotykana awaria. Z powyższego przykładu widać, że nie jest to sposób w 100% bezpieczny i pewny na zabezpieczenie danych. Zawsze może zdarzyć się wypadek, gdzie mogą zajść różne zbiegi okoliczności, a nałożone na siebie różne sytuacje powodują poważne usterki i brak dostępu do danych.
Nic nie zastąpi backupu na zewnętrznym dysku. Nic nie zastąpi zdrowego rozsądku. Dlatego zachowujmy dystans od automatyzacji i technologii autobackupu. Powyższy przypadek to jednak prawdziwa nauczka, jak z pozoru bezpieczne systemy RAID bardzo szybko mogą ulegać degradacji. W tym przypadku nie pomógł nawet dodatkowy dysk hot spare, który dodatkowo miał zabezpieczać macierz przejmując rolę uszkodzonego dysku. Niestety to rozwiązanie kompletnie w tym przypadku, nie zadziałało.