Статті

У цьому розділі Ви знайдете основну інформацію щодо відновлення та доступу до даних,а також корисні поради з цієї теми.

Download software

RAID: організація даних

Різні рівні RAID застосовують різні методи організації даних для різних цілей. Кожен рівень RAID-систем має свої переваги та недоліки в продуктивності та експлуатації.

Можливості відновлення даних з складних систем RAID багато в чому залежать від рівня масивів RAID та фактичних причин втрати даних. Тим не менш, ви можете вплинути на ситуацію та збільшити шанси відновлення даних, оскільки ви обираєте ефективне та надійне програмне забезпечення для відновлення даних, яке працює з будь-яким RAID-рівнем і здатне вирішувати навіть складні завдання.


Терміни масивів RAID

Технічна інформація щодо масивів RAID, як правило, надається в спеціальних умовах, що описують ці типи сховищ. Нижче ви знайдете найбільш часто використовувані терміни, що відносяться до складних сховищ RAID.

  • RAID (Redundant Array of Independent Disks). Термін позначає схему зберігання, в якій безліч незалежних сховищ об'єднано в один. Залежно від фактичної організації даних сховища ця схема підвищує її стійкість, продуктивність та/або надійність.

  • Апаратний RAID – RAID, що базується на обладнанні. Апаратне забезпечення RAID складається з мікросхеми або плати RAID-контролера, що використовує масив і набір прикріплених дисків. Операційна система виявляє складне сховище RAID в якості одного твердого пристрою зберігання даних. Дані керуються апаратним контролером і можуть бути налаштовані за допомогою параметрів BIOS.

  • Програмний RAID. Програмний RAID не використовує жодного апаратного забезпечення та створюється операційною системою на наборі незалежних блоків сховища. Операційна система розпізнає програмне забезпечення для сховища RAID як один твердий пристрій для зберігання даних. Дані керуються драйверами ОС, що використовують процесорний час, не потребуючи додаткового обладнання (наприклад, програмні RAID NT LDM, Linux, BSD, macOS RAID, такі як LVM/LVM2 або MD).

  • Віртуальний RAID – апаратний або програмний RAID, який практично реконструйований з його компонентів. Це віртуальне сховище, створене програмним забезпеченням для відновлення даних, щоб імітувати оригінальне зберігання RAID з метою відновлення даних.

  • Компонент RAID (одиниця) – диск або дисковий розділ, який використовується як сховище даних для зберігання RAID.

  • Дзеркалювання – техніка організації даних, заснована на реплікації даних на окремі одиниці. Дзеркало створює повну копію однієї одиниці та використовує інший пристрій для зберігання цієї копії. Це забезпечує високу відмовостійкість: якщо один пристрій не працює, залишається ще одна копія даних, розташованих на інших блоках цього RAID. Техніка дзеркалювання реалізована на рівні RAID 1.

  • Страйпінг – техніка організації даних, заснована на розподілі фрагментів даних серед одиниць. Страйпінг даних дозволяє користувачам значно збільшити продуктивність вводу/виводу (I/O) RAID-сховища. Дані про RAID поділяються на дрібні частини (смужки) і розподілені по всіх доступних одиницях. Страйпінг прискорює продуктивність зберігання завдяки паралельному читанню/запису на всі пристрої самостійно. Страйпінг використовується в RAID 0.

  • Парність – технологія організації даних, заснована на додаванні частини даних з різних RAID-одиниць в окрему одиницю. Парність дозволяє збільшити відмовостійкість накопичувача: у випадку будь-якого збою диску вміст несправних дисків може бути реконструйований на запасному диску шляхом додавання даних з решти дисків за умови, що тільки один диск не працює.

  • Код Ріда-Соломона – алгоритм корекції помилок на основі алгебри Галуа. Код Ріда-Соломона дозволяє підвищити надійність RAID-сховища. Цей алгоритм використовується в RAID 6.

Типи масивів RAID (рівні)

Рівні накопичувачів RAID відрізняються в застосуванні методів організації даних. Нижче наводиться детальний опис найбільш широко використовуваних типів RAID з інформацією про переваги та недоліки кожного рівня.

RAID, рівень 0 (RAID0, страйпінг даних)

Рівень RAID 0 – найкращий приклад страйпінгу даних. Термін "RAID – резервний масив незалежних дисків" насправді не пояснює функціональність цього рівня RAID, оскільки він взагалі не передбачає надмірності. Цей тип зберігання може складатися з двох і більше одиниць. Страйпи визначаються як фрагменти даних, де кожний наступний страйп даних знаходиться на наступному блоці зберігання.

RAID 0 страйпи

Рисунок 1. Організація страйпів на RAID 0 (2 одиниці)

На рисунку 1 показано страйпінг даних RAID 0. Така схема організації даних дозволяє пришвидшити операції введення/виводу до U разів (де U - кількість одиниць в RAID 0) Це досягається шляхом надсилання одночасних або наступних запитів вводу/виводу на різні одиниці (як правило, різні жорсткі диски). Наприклад, для читання страйпів 0..3 (сегмент даних з розміром 4 страйпи) контролер надсилає 2 одночасних запити на читання: щоб прочитати два перші страйпи з блоку 1 та два перші страйпи з блоку 2. Одиниці здійснюють фізичне читання одночасно, а Контролер отримує результат вдвічі швидше.

Переваги RAID, рівень 0:

  • Надзвичайно висока продуктивність як у режимі читання, так і запису;

  • Проста реалізація (навіть більшість бортових контролерів SATA підтримують RAID 0);

  • До 100% дискового простору для даних;

  • Найдорожче рішення RAID.

Недоліки

  • Відсутність відмовостійкості: збій одного пристрою призводить до втрати даних.

Перспективи відновлення

  • Відмова контролера/розбирання масиву: інформація про розмір страйпу та одиниці замовлення дозволяє легко відновлювати втрачені дані.

  • Пошкоджений пристрій: як тільки будь-яка з одиниць стане нечитабельною, відновлення даних для наступних сегментів даних, що виходять за рамки StripeSize * (UnitsCount-1), неможливе.

RAID, рівень 1 (RAID1, дзеркальне відображення даних)

RAID level 1 реалізує технологію дзеркалювання даних. Дзеркалювання створює точну копію даних і зберігає її на окремому диску, призначеному для цього. Потужність RAID 1 дорівнює розміру найменшого блоку зберігання мінус простору, яку може зарезервувати контролер. Коли контролер зчитує дані з RAID 1, він може надсилати запити на будь-який з дисків для прискорення операцій введення-виведення. Робота над писанням працює або в паралельному режимі (обидва диска одночасно – швидше) або, отже, (на один диск за іншим – відмовостійкість). RAID 1 не включає сегментацію даних.

Переваги RAID, рівень 1:

  • Швидкі операції читання;

  • Підвищена відмовостійкість;

  • Продовження роботи навіть принаймні з одним дзеркальним диском (в "деградованому режимі");

  • Одне з найбільш доступних рішень, що підтримується більшістю бортових контролерів SATA.

Недоліки

  • Найефективніше використання дискового простору;

  • Низька операція запису.

Перспективи відновлення

  • Несправність контролера/розбирання масиву: легко відновити всі дані з будь-якої одиниці;

  • Пошкоджений пристрій: дані можуть бути відновлені з будь-якого читабельного блоку.

RAID, рівень 4 (RAID 4, страйп-сет з виділеною парністю)

RAID 4 – перша спроба компромісу між відмовостійкістю, швидкістю та вартістю. Техніка, реалізована в RAID 4, базується на звичайному наборі страйпів (як у RAID 0), розширеному ще однією призначеною одиницею для зберігання даних про парність для управління помилками. Цей масив може складатися з 3 або більше дисків. Насправді, ця схема зберігання даних також реалізується на рівні RAID 3, при цьому різниця в методі стрибує становить байтовий рівень для RAID3 і рівня блоку (сектора) для RAID 4.

RAID 4 страйпи

Рисунок 4. Набір страйпів із заданим співвідношенням (RAID 4)

На рисунку 4 показано метод роботи відмовостійкості. Страйп зберігає фактичні дані RAID. Кожна "колонка" страйпів підсумовується з XOR для досягнення парності. 

RAID 4 має такі спільні з RAID 0 функції, як швидке читання операцій і великий обсяг пам'яті, в той же час цей рівень RAID містить власну функцію розширеної внутрішньої корекції помилок. Якщо страйп стає нечитабельним, контролер здатний відновити його на основі інформації інших страйпів та співвідношення. Диск, призначений для парності, не використовується для зберігання даних, а як блок резервного копіювання. 

Переваги RAID 4:

  • Все більш швидкі операції читання;

  • Висока відмовостійкість;

  • Працює в "деградованому режимі", якщо один із дисків не працює, виходячи з парності;

  • Ефективне рішення в аспекті відмовостійкості за гроші.

Недоліки

  • Повільні операції запису: будь-які операції запису/оновлення вимагають оновлення відомостей парності на одному виділеному диску;

  • Повільне читання операцій у деградованому режимі через високе навантаження на одиницю парності.

Перспективи відновлення

  • Відмова контролера/розбирання масиву: легко відновити всі дані. Необхідні диски N-1, перевага надається розділам даних (для створення віртуального RAID 0); необхідна інформація про порядок дисків та розміру страйпу;

  • Пошкоджений пристрій: шанси відновлення близькі до 100%, якщо не вистачає більше одного диска. Якщо два або більше дисків не працюють, виникає така ж проблема, що й у RAID 0.

RAID, рівень 5 (RAID 5, страйп-сет з розподіленою парністю)

В даний час RAID 5 є найкращим компромісом в аспекті відмовостійкасті, швидкасті та витрат. Техніка, що використовується в RAID 5, базується на звичайному наборі страйпів (як у RAID 0), що на цьому рівні об'єднує дані та інформацію про парність. Подібно до RAID 4, він вимагає принаймні 3 диска, але не має призначеного диска для зберігання інформації про парність, не створюючи такої «черги» для оновлення парності під час операцій запису. 

Залежно від мети, реалізації, роздрібної торгівлі та інших факторів RAID 5може відрізнятися за методами розподілу парності по набору страйпів. Серед найбільш поширених відносяться: лівий симетричний (зворотній динамічний розподіл парності), правий симетричний (прямий динамічний розподіл парності), лівий асиметричний (зворотній розподіл парності) і право асиметричне (прямий розподіл парності).

RAID 5 лівий симетричний

Рисунок 5. Розподіл лівого симетричного співвідношення (RAID 5)

RAID 5 лівий асиметричний

Рисунок 6. Лівий асиметричний розподіл парності (RAID 5)

RAID 5 правий симетричний

Рисунок 7. Правий симетричний розподіл парності (RAID 5)

RAID 5 правий асиметричний

Рисунок 8. Правий асиметричний розподіл парності (RAID 5)

Відмовостійкість досягається за допомогою тих самих засобів, що і в RAID 4: страйп містить дані про фактичні дані та інформацію про парність; кожен стовпчик страйпів підсумовується в страйп парності. 

RAID 5 поєднує в собі можливості RAID 0 (операції швидкого читання та велика ємність) та RAID 4 (розширена внутрішня корекція помилок). Якщо страйп стає нечитабельним, контролер може перебудувати його на основі інших страйпів та інформації про парність. Фактична ємність пам'яті RAID5 (U-1) * (-(розмір одиниці) – зарезервовано). 

Переваги RAID 5:

  • Швидші операції читання;

  • Швидкий запис в залежності від даних і методу розподілу парності;

  • Відмовостійкість;

  • RAID може працювати в "деградованому режимі", якщо один диск не працює;

  • Ефективне рішення в аспекті відмовостійкості.

Недоліки

  • Повільніші операції запису в порівнянні з RAID 0;

  • Швидкість написання операцій залежить від методу розподілу вмісту та парності.

Перспективи відновлення

  • Несправність контролера/розбирання масиву: легко відновити всі дані. Надається перевага неушкодженим дискам, але потрібні N-1; необхідна інформація про порядок дисків, розміру смуги та методу розподілу парності;

  • Пошкоджений пристрій: шанси відновлення близькі до 100%, якщо не вистачає більше одного диска. Якщо 2 або більше дисків не працюють, виникає така ж проблема, що й у RAID 0.

RAID, рівень 6 (RAID 6, страйп-сет з подвійною розподіленою парністю)

Будучи надійним і в той же час економічно вигідним рішенням для зберігання даних, RAID 6 був створений з метою розширення RAID 5 ще одним страйпом для надлишковості даних. Для цього використовується алгоритм коду Ріда-Соломона на основі алгебри Галуа. Ця методика дозволяє додавати ще один блок для надлишковості даних та ефективно корегувати помилки диска. 
Організація даних на RAID 6 схожа на RAID 5: дані та співвідношення (P-страйп) розподіляються між блоками зберігання даних. Різниця полягає в додатковому страйпі (Q-страйп), розташованій поряд з P-страйпом та містить суму даних GF. 
Для отримання додаткової інформації про алгоритми RAID 6 та Q-страйпи, будь ласка, перейдіть до http://www.cs.utk.edu/~plank/plank/papers/CS-96-332.html

Переваги RAID 6:

  • Швидше читання операцій;

  • Швидка операція запису залежно від даних та методу розподілу парності;

  • Висока відмовостійкість;

  • RAID може працювати в "деградованому режимі", якщо один диск або навіть 2 диска не працюють;

  • Ефективне рішення в аспекті відмовостійкості за розумні гроші.

Недоліки

  • Повільніші операції запису в порівнянні з RAID 0;

  • Швидкість написання операцій залежить від методу розподілу вмісту та парності.

Перспективи відновлення

  • Несправність контролера/розбирання масиву: легко відновити всі дані. Надається перевага неушкодженим дискам, але необхідні N-1 або N-2; необхідна інформація про порядок дисків, розміру страйпу та методу розподілу парності;

  • Пошкоджений блок: шанси відновлення близькі до 100%, якщо не більше двох дисків зазнали збою. Якщо більше 2 дисків не працюють, виникає така ж проблема, як і у випадку RAID 0.

Вкладений RAID: рівень 0+1, рівень 10, рівень 50, рівень 51 тощо.

Вкладені RAID на базі RAID 0, 5 рівня та 1 рівня підвищують продуктивність RAID-систем. Рівень RAID 0+1 використовує дзеркало страйп-сетів для підвищення відмовостійкості, не впливаючи на продуктивність сховища. Рівень RAID 10 застосовує розширення страйпів, що відображає дані, що покращують продуктивність і збільшують використання пам'яті. Рівень RAID 0+1 і рівень 10 вимагають як мінімум 4 диска. RAID 50 - це страйп-сет накопичувача RAID 5, створеного з міркувань продуктивності, і RAID 51 є дзеркалом RAID 5, створеним для відмовостійкості (для цього потрібно щонайменше 6 дисків). Нижче наведено приклади для RAID 0+1 та RAID 10.

RAID 01 страйп

Рисунок 2. Організація даних на дзеркалі страйпів (RAID 0+1, 6 одиниць)

RAID 10 страйпи

Рисунок 3. Організація даних по на страйпі дзеркал (RAID 10; 6 одиниць, 2x3 дзеркала)

Переваги вкладеного RAID:

  • Збільшена швидкість або відмова;

  • RAID може працювати в деградованому режимі;

  • Найбільш доступними є рішення RAID 10 і RAID 0+1 (деякі бортові контролери підтримують ці типи RAID).

Недоліки

  • Найдорожче рішення, оскільки більшість дискового простору використовується для дзеркал;

  • Важко управляти/обслуговувати.

Перспективи відновлення

  • Несправність контролера/розбирання масиву: легко відновити всі дані;

  • Пошкоджений пристрій: шанси відновлення близькі до 100%, якщо можна практично зібрати щонайменше один набір страйпів (RAID 10, RAID 50) або принаймні один екземпляр дзеркала (RAID 0+1, RAID 51).

Починаємо

З огляду на вищезазначені можливості відновлення даних та використання ефективного програмного забезпечення, що спеціалізується на відновленні та відновленні систем RAID, користувачі можуть легко відновлювати дані з вашого сховища RAID самостійно. Для початку сканування RAID потрібна така інформація:

  • Рівень RAID;

  • Схема макета RAID по всіх блоках;

  • Параметри RAID – порядок одиниць, розмір страйпу, розподіл парності (якщо застосовується).

Після операції відновлення ви можете зберегти файл зображення вашого RAID-сховища в безпечне місце та завантажити його в програмне забезпечення для відновлення даних для подальшого аналізу. 
Ми рекомендуємо UFS Explorer RAID Recovery як ефективне програмне забезпечення, що спеціалізується на системах RAID. Ця програма підтримує віртуальну реконструкцію та відновлення даних з:

  • RAID-масиви рівнів 0, 1, 0 + 1, 10, 4, 5, 6, 50, 51, RAID 7 (апаратний варіант RAID 4);

  • Деградовані RAID-масиви рівня 1, 0 + 1, 10, 5 і 6;

  • Файлові системи, що використовуються для сховищ NAS та серверів з RAID масивами.

Останнє оновлення: 05.07.2018