SMART ou l'art de la surveillance de nos HD
Par Herve, vendredi 21 janvier 2005 à 16:47 :: Général :: #25 :: rss
Souvent avant un crash disque, quelques symptômes apparaissent.
Le paquetage smartmontools utilise le protocole S.M.A.R.T. présent sur la plupart des hd ide, pour diagnostiquer ces symptômes (en fait S.M.A.R.T. donne une probabilité d'erreur suivant un seuil donné par le fabricant).
Après une install par apt-get, on active S.M.A.R.T. grace à smartctl --smart=on --offlineauto=on --saveauto=on /dev/hda
On possède alors deux nouveaux outils : smartctl et smartd
- smartctl fournit les attributs de S.M.A.R.T. (liste des attributs sur smartlinux.sourceforge.net/smart/attributes.php)
- smartd est un démon qui utilise smartctl en selftest, fait remonter les erreurs et peut les communiquer
par mail, sms, etc ...
Sur ma vielle bécanne, avec son vieux hd ide, la procédure de selftest (smartctl -t short /dev/hda) ne marche pas, donc impossible d'utiliser le démon smartd, on peut alors utiliser un petit script :
etat=($(smartctl -A /dev/hda |grep ^[^A-Za-z=] |awk '{printf $9" "}'))
# $9 est le champ WHEN_FAILED qui indique la probabilité d'une erreur
n=${#etat[*]}
i=0
error=0
while [ $i -lt $n ]
do
if [ ${etat[$i]} != "-" ]
# lorsque la probabilité d'erreur est presque nulle $9 contient un -
then error=$(($error+1))
fi
i=$(($i+1))
done
echo "nombre d'erreurs disque :"$error
A partir de là tout est envisageable, j'ai par exemple placé ce script sur Nagios avec NRPE.
Voilà, ne soyez pas trop dur c'est mon premier billet sur le blog !
Rv
Sources : - http://smartmontools.sourceforge.net - GNU/Linux magazine france (janvier 2005) - manpage smartctl !

Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.