Le paquetage smartmontools utilise le protocole S.M.A.R.T. présent sur la plupart des hd ide, pour diagnostiquer ces symptômes (en fait S.M.A.R.T. donne une probabilité d'erreur suivant un seuil donné par le fabricant).

Après une install par apt-get, on active S.M.A.R.T. grace à smartctl --smart=on --offlineauto=on --saveauto=on /dev/hda

On possède alors deux nouveaux outils : smartctl et smartd

par mail, sms, etc ...

Sur ma vielle bécanne, avec son vieux hd ide, la procédure de selftest (smartctl -t short /dev/hda) ne marche pas, donc impossible d'utiliser le démon smartd, on peut alors utiliser un petit script :

etat=($(smartctl -A /dev/hda |grep ^[^A-Za-z=] |awk '{printf $9" "}'))

# $9 est le champ WHEN_FAILED qui indique la probabilité d'une erreur

n=${#etat[*]}

i=0

error=0

while [ $i -lt $n ]

do

if [ ${etat[$i]} != "-" ]

# lorsque la probabilité d'erreur est presque nulle $9 contient un -

then error=$(($error+1))

fi

i=$(($i+1))

done

echo "nombre d'erreurs disque :"$error

A partir de là tout est envisageable, j'ai par exemple placé ce script sur Nagios avec NRPE.

Voilà, ne soyez pas trop dur c'est mon premier billet sur le blog !

Rv

Sources : - http://smartmontools.sourceforge.net - GNU/Linux magazine france (janvier 2005) - manpage smartctl !