Disker som kommer og disker som går
Etter å ha kjøpt meg ny server, og en hel haug med disker, satte jeg et par av de gamle diskene i en annen boks, og fortsatte å kjøre mail + web på den boksen. Den nye serveren er kun til filserver.
Det som selvsagt skjedde etter bare et par uker, var at en av de gamle diskene kræsja.
Jeg hadde heldigvis vært fremsynt nok til å sette dem opp i RAID-1, så jeg mistet heldigvis ingen data.
mdadm på serveren var hyggelig nok til å sende en høflig mail om hva som hadde gått galt :
This is an automatically generated mail message from mdadm
running on archaic
A Fail event had been detected on md device /dev/md0.
It could be related to component device /dev/hda5.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid1]
md0 : active raid1 hda5[2](F) hdg5[1]
78051648 blocks [2/1] [_U]
unused devices:
Akkurat ja, hda har feilet, og hdg lever. Hmm, synd at hda inneholder /boot, samt grub, og at akkurat den biten ikke er duplisert på hdg…
Jeg har altså alle data intakt, men rebooter jeg, så sliter jeg.
Heldigvis er partition table på hda og hdg helt like, så jeg kopierer /boot over på hdg (hadde en 100MB partisjon til /boot på hda, tilsvarende 100MB på hdg ble brukt til swap).
I dette øyeblikket skrur jeg av maskinen og bytter ut hda med en ny disk, men jeg hadde selvsagt glemt å legge inn grub på hdg.
Etter litt panikk, så dyttet jeg inn en gammel debian-CD jeg hadde liggende, og bootet den i rescue mode. Den inneholdt selvsagt ingen grub eller grub-install.. men jeg fikk mountet disken min, hvor disse jo lå fra før.
Litt magi senere (måtte bla. lage en chroot av mountpointet for å få lov til å kjøre grub-install, samt at jeg også måtte mounte /boot), så var grub installert, og jeg fikk endelig lov til å boote på vanlig måte.
Nå var det tid for å få RAIDet opp igjen!
Først gjorde jeg partition table på den nye hda helt likt som det på hdg :
# sfdisk -d /dev/hdg | sfdisk /dev/hda
(Den nye disken er på 160GB, og ikke på 80GB som den gamle + hdg, men sålenge partisjonene er like store er det ett fett.)
Så la jeg til nye hda til raidet :
# mdadm --manage /dev/md0 --add /dev/hda5
Nå kunne jeg se i /proc/mdstat at recovery hadde startet :
md0 : active raid1 hda5[2] hdg5[1]
78051648 blocks [2/1] [_U]
[===================>.] recovery = 97.0% (75720064/78051648) finish=1.6min speed=23547K/sec
Når den endelig var ferdig, sørget jeg for å ha en fungerende /boot-partisjon på begge disker, samt grub installert på begge. Så slipper jeg boot-trøbbel til neste gang (som jeg håper blir lenge til).
Alt i alt er jeg glad for at jeg gikk for RAID-1, og det var jo litt fint å få se at det faktisk fungerte også!