Рассмотрим порядок действий проверки дисков выделенного сервера, с которого пришла ошибка SMART, выявления и замены неисправного диска в массиве Raid-1.
- Вводим команду для проверки состояния raid
cat /proc/mdstat
- Если в выводе в квадратных скобках стоит знак _ (например [U_]) — диск требуется заменить (он выпал из рейда).
в данном примере всё с raid всё в порядке. Если бы было так: [U_], то диск sdb неисправен, если так: [_U], то sda (смотрим порядок в md-устройствах, например: md2 : active raid1 sda3[2] sdb3[3])
- Если raid в порядке, то нужно проверить каждый диск отдельно следующей командой:
smartctl -a /dev/sd[X]
[X] меняем на a или b в зависимости от диска, список дисков можно посмотреть командой:
ls -l /dev/ | grep sd
Оцениваем состояние диска по параметрам и выявляем неисправный, смотрим:
- количество перераспределенных секторов (Reallocated Sector)
- количество часов работы
- наличие ошибок смарт (сделайте коротки и расширенный тест SMART)
- нагрузка на диск в atop
- и другие параметры, определение неисправного диска по параметрам SMART, это тема отдельной статьи, поищите подробную информацию в интернете.
- Узнаём серийный номер неисправного диска командой:
smartctl -a /dev/sd[X]
- Перед заменой диска крайне желательно необходимо сделать резервную копию данных
- Отключаем поврежденный диск от рейда. Для этого нужно пометить разделы диска как сбойные и изъять их из массива, для этого воспользуемся командой:
mdadm /dev/md0 -f /dev/sdb1 &&mdadm /dev/md0 -r /dev/sdb1
В зависимости от количества разделов выполняем соответственно для разных разделов:
mdadm /dev/md1 -f /dev/sdb2 &&mdadm /dev/md1 -r /dev/sdb2
mdadm /dev/md2 -f /dev/sdb3 &&mdadm /dev/md2 -r /dev/sdb3
Далее команда на удаление из RAID
mdadm /dev/md0 --remove /dev/sdb1
mdadm /dev/md1 --remove /dev/sdb2
mdadm /dev/md2 --remove /dev/sdb3
- Отправляем в дата-центр запрос на замену, к запросу также прикладываем модель и серийный номер исправного диска, узнать их можно командой:
hdparm -i /dev/
- После замены диска новый диск нужно разбить, в зависимости от типа разбиения диска (MBR или GPT).
Для проверки типа разбиения надо выполнить следующую команду:
gdisk -l /dev/sda
на не замененном диске
После этого выполнить команду:
sfdisk -d /dev/sda | sfdisk /dev/sdb
(для MBR), и
sgdisk -R /dev/sdb /dev/sda
(структура разделов в этой команде копируется из /dev/sda в /dev/sdb)
sgdisk -G /dev/sdb
(для GPT)
- Добавить новый диск в массив командами:
mdadm /dev/md0 -a /dev/sdb1
mdadm /dev/md1 -a /dev/sdb2
mdadm /dev/md2 -a /dev/sdb3
- Добавить загрузчик командой:
grub-install /dev/sdb