OVH : une méga-panne LOL

Daniel Schneidermann - - Numérique & datas - Le matinaute - 92 commentaires

Les matinautes qui, chaque matin, dès neuf heures quinze, se connectent sur leur chronique préférée, ont été plongés hier dans un abîme existentiel, et dans une profonde dépression. Pas de chronique ! Et même, plus du tout de site Arrêt sur images. Enquête expresse faite, c'est notre hébergeur tout entier, OVH, qui était "down", comme on dit, mettant hors ligne, durant une heure et demie, des milliers de sites dans le monde, dont celui de l'Assemblée nationale . 

OVH est ce qu'on appelle une "licorne française". Un petit géant des serveurs que le monde nous envie, et qui doit entrer en bourse ce vendredi. Elle gère des serveurs de par le monde, et c'est justement un de ses "data centers" de Virginie, à Vint Hill, qui a provoqué la panne. Plus précisément, a tweeté son fondateur Octave Klaba, un "mauvais copier-coller dans le code, effectué sur deux lignes au lieu d'une".  Pire encore, c'est un caractère mal placé, un seul, le "4" (voir ci-dessous) qui a fait tomber des milliers de sites dans le monde, pendant une heure et demie. À noter que cette erreur fatale de copier-coller a été commise par un ingénieur virginien, dans le cadre d'une opération destinée à lutter contre la recrudescence des "attaques DDOS" visant OVH (DDOS : "attaques par déni de service distribué", qui visent à rendre un serveur ou un service indisponibles). 

 Dans un souci de transparence, "Octave" a donc tweeté le copier-coller fautif, avant d'effacer son tweet. Pour donner une idée plus générale de la communication de crise du patron, je retrouve cette explication d'une ancienne panne, de 2015,  que  je ne résiste pas à livrer en totalité  : " L’un des ingénieurs de l’équipe network a effacé par erreur la configuration OSPF sur l’un de nos 2 routeurs de Paris, gsw-1-a9 ». Un incident couplé ensuite à un suivant : « nous avons eu un bug BGP sur le 3eme routeur reflector, rf-3-a1 qui n’a pas communiqué au reste de la backbone que gsw-1-a9 est down. rf-2-a1 l’a fait et rf-1-a1 a été down durant la panne. Du coup la backbone continuait à se comporter comme si le routeur gsw-1-a9 était UP. Nous avons redémarré toutes les sessions BGP sur rf-3-a1 mais sachant que rf-1-a1 a été en panne avec gsw-1-a9, et donc que seulement rf-2-a1 assurait la synchronisation BGP entre tous les routeurs en Europe, nous avons eu des yoyos dans le réseau en Europe". Et "Octave" de conclure, avec l'humour proverbial des geeks : "On va déterrer la hache pour s’occuper des doigts de mes gars ..."

 L'introduction en bourse de OVH est destinée à "accélérer sa trajectoire de croissance en consolidant sa position en Europe et en poursuivant son expansion en Amérique du Nord et en Asie". Personne ne sait à l'heure actuelle si la recrudescence des attaques DDOS contre la société a pour but d'entraver cette introduction en bourse. Accessoirement, l'incident révèle que les attaques DDOS ne cessent de se multiplier par le monde, passant selon Numerama, du "statut de bruit de fond, à celui de problème majeur affectant notre vie quotidienne".

S'il y a de plus en plus d'attaques DDOS, il y aura donc de plus en plus de méga-pannes, comme il y a déjà des méga-feux, des méga-porte-containers s'entassant dans des méga-embouteillages et provoquant des méga-pénuries. Mais à la différence des catastrophes écologiques, sanitaires, ou économiques, généralement opaques et verticales, la méga-panne sera horizontale. La méga-panne est transparente, ludique, complice, à la limite du LOL. Elle se vit dans la communauté, comme un grand jeu scout, ou un week-end de cohésion d'entreprise en forêt, avec gourde et canif (et haches, donc, pour couper les doigts des maillons faibles). Le grand effondrement sera LOL, ou ne sera pas.

MAJ, 9 h 46 : dans une première version de cette chronique, le texte "d'Octave" de 2015 était par erreur daté de 2021. Le matinaute tend ses doigts à la hache.

Lire sur arretsurimages.net.