20% des usagers ont été impactés par cet incendie.
Sauf dans un seul cas où la base de données était incomplète, tous les sites ont repris vers 8h 30 après une panne de 6h en partant des données de la veille. En effet, la sauvegarde du jour, programmée entre 2 et 4 h du matin n'a pu être effectuée dans la plupart des cas.
Aujourd'hui, nous avons pu récupérer la base de données manquante, les logs de fréquentation du jour précédent pour compléter les statistiques et les nouveaux fichiers créés. Vous pouvez écrire au sav pour obtenir un lien vers les bases de données juste avant la panne, accéder au backup de l'ancien ftp ou obtenir une copie des nouveaux fichiers dans un répertoire particulier du site correspondant.
Nul n'est maitre de la chaine internet de bout en bout. L'offre d'héberger des serveurs dans ce merveilleux data a été alléchante et nul n'aurait pu fournir des garanties suffisantes de fonctionnement total avec les technologies courantes ni prévoir ce désastre.
Notez cependant que nous nous étions donnés les moyens de réagir vite avec les sauvegardes quotidiennes systématiques et que nous avons eu la capacité de minimiser l'interruption de service en fournissant un énorme travail entre 4h 30 et 8h 30 pour pouvoir reprendre immédiatement dans des conditions acceptables sinon parfaites.
Entre temps, nous avons amélioré notre procédure de sauvegarde mysql et corrigé l'erreur en faisant fi de la documentation.
Sachant maintenant que le risque d'un effondrement massif localisé n'est pas nul, nous avons entrepris la production de clusters multi datacenters, tant pis pour la perte de 5% des performances maximales.