Tu gères un serveur Linux et un jour… plus rien ne répond. Voici les 5 erreurs les plus fréquentes que je vois chez mes clients — et comment les éviter.

1. Un rm -rf mal placé

La commande la plus destructrice de Linux. Une mauvaise variable non définie dans un script et c’est le drame :

rm -rf $DOSSIER/   # Si $DOSSIER est vide → rm -rf /

Comment éviter : Toujours vérifier ses variables avec set -u dans les scripts, et utiliser --preserve-root (actif par défaut sur les distributions récentes).

2. Un firewall qui bloque tout

Un ufw enable sans avoir autorisé SSH d’abord, et tu perds l’accès à ton serveur :

sudo ufw allow ssh    # TOUJOURS faire ça en premier
sudo ufw enable

Comment éviter : Toujours autoriser SSH avant d’activer le firewall. Avoir un accès console (KVM/IPMI) en plan B.

3. Une partition /var saturée

Les logs s’accumulent, /var/log grossit, et quand le disque est à 100% plus rien ne fonctionne — ni les bases de données, ni les services système.

df -h /var              # Vérifier l'espace
du -sh /var/log/*       # Identifier les gros fichiers
sudo journalctl --vacuum-size=200M  # Nettoyer les logs systemd

Comment éviter : Configurer logrotate, monitorer l’espace disque avec des alertes.

4. Des mises à jour sans reboot

Le kernel a été mis à jour mais le serveur tourne toujours sur l’ancien. Les patchs de sécurité ne sont pas appliqués tant que le service ou le système n’a pas redémarré.

needs-restarting -r   # CentOS/RHEL : vérifie si un reboot est nécessaire
cat /var/run/reboot-required  # Debian/Ubuntu

Comment éviter : Planifier des fenêtres de maintenance mensuelles. Utiliser needrestart sur Debian/Ubuntu.

5. Des scripts cron buggés non monitorés

Un cron qui tourne toutes les minutes, échoue silencieusement, et remplit les logs ou accumule des processus zombies.

crontab -l                           # Lister les crons actifs
grep CRON /var/log/syslog | tail -20 # Vérifier les exécutions récentes

Comment éviter : Toujours rediriger la sortie des crons vers un fichier de log, et surveiller les erreurs.


➡️ Besoin d’aide pour un audit ou un dépannage serveur ? Contacte-nous