Мониторинг и восстановление программного RAID

Информация о всех RAID-массивах:

# more /proc/mdstat

или

# cat /proc/mdstat

Мониторинг состояния

Информация о конкретном дисковом разделе:

# mdadm -E /dev/sd<1-10>

например:

# mdadm -E /dev/sdb2


Восстановление функционирования

Восстановление функционирования (rebuild) разделов диска по одному после однократного «несмертельного» сбоя:

# mdadm -a /dev/md<0-6> /dev/sd<1-10>

например:

# mdadm -a /dev/md0 /dev/sdb1

Нужно быть аккуратным с номерами разделов. В случае ошибки, удалить компонент из RAID командой:

# mdadm -r /dev/md0 /dev/sdb1

получается не всегда — устройство может быть занято.

Замена диска

1. Выключить компьютер и заменить диск

2. Включить компьютер и определить имеющиеся на обоих дисках разделы:

# fdisk /dev/sd -l

3. С помощью fdisk создать на новом диске разделы, идентичные оригиналу. Необходимо пометить нужный раздел нового диска (sda1 или sdb1) как загрузочный до включения в зеркало. Swap-разделы не подлежат зеркалированию в программном RAID.

4. Выполнить Мониторинг состояния и Восстановление функционирования

Настройка оповещения

Мониторинг выполняется с помощью crond ежечасно.
В папку /etc/cron.haurly помещен файл mdRAIDmon, содержащий команду:

# mdadm —monitor —scan -1 —mail=postmaster@domain.name.ru

Для проверки рассылки сообщения добавляется ключ —test:

# mdadm —monitor —scan -1 —mail=postmaster@domain.name.ru —test

Помещая файл задания в папку, необходимо установить права доступа на выполнение. Если нужно чаще, самое простое, добавьте в /etc/crontab строку, используя нотацию с «/», например:

*/5 * * * * root run-parts /etc/cron.my5min

Конечно, можно попробовать и другие варианты планирования заданий с atd или batch.

Создайте папку /etc/cron.my5min и поместите туда файл mdRAIDmon
C имитацией отказа диска мне было проще — сервер SR1425BK1 — с корзиной HotSwap

Оригинал — www.opennet.ru/tips/info/881.shtml


Понравилась статья? Поделись с остальными.

Комментарии закрыты.