IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

OVHcloud : Octave Klaba annonce l'adoption d'une nouvelle politique de sauvegarde gratuite des données de tous les clients
Et la remise à la police des onduleurs et batteries détruits par l'incendie

Le , par Patrick Ruiz

44PARTAGES

12  0 
La survenue de l’incendie sur les installations strasbourgeoises d’OVH a provoqué le départ en fumée de tous les serveurs du jeu Rust. C’est plus qu’une évidence, plusieurs autres organisations sont impactées avec des données irrécupérables. La fameuse question de gestion des sauvegardes refait surface à l’ère du cloud qui a le vent en poupe. OVH s’explique en soulignant qu’il offre du hosting. Néanmoins, l’entreprise entend introduire une révolution dans la filière à la faveur de ses clients.


Octave Klaba annonce l’adoption d’une nouvelle politique de sauvegarde gratuite des données de tous les clients : « Il semble que les consommateurs à l’échelle globale ne comprennent pas notre offre. Cela fait déjà trop de discussions autour de cet aspect. Nous ne voulons pas nous enfoncer dans cette brèche. Nous allons plutôt revoir la sécurité à la hausse en offrant le plus haut niveau de sauvegarde pour tous nos clients de tous nos centres de données. Cela va changer les standards de l’industrie, ainsi que notre façon d’offrir nos services. »

Le fondateur d’OVH a passé l’annonce dans le cadre d’une mise à jour de gestion de l’après-incendie d’une dizaine de minutes. Celle-ci contenait de bonnes et de mauvaises nouvelles pour les centres de données du site de Strasbourg, dont l'un – SBG1 – a été fortement endommagé dans l'incendie qui a emporté SBG2. Un autre, SBG3, a été partiellement touché et le quatrième, SBG4, n'a pas été touché.

Le point positif est que l'alimentation électrique et le réseau optique ont été restaurés sur le site. Des onduleurs et des systèmes électriques de remplacement ont été installés et doivent faire l'objet de validation sous peu. Le refroidissement par eau fonctionne, les réseaux de haut niveau ont été rétablis et les travaux sur les réseaux des salles individuelles du centre de données vont bientôt commencer. 2500 serveurs ont été mis sur pied et OVH aura ajouté 15 000 nouvelles machines d'ici la fin du mois de mars. Le rétablissement de nombreux services semble être en bonne voie pour commencer la semaine prochaine.

La mauvaise nouvelle est que deux racks du centre de données SBG1 – 61E et 62E – pourraient prendre plus de temps à restaurer que les autres. Des développements précédents sur SBG1 ont laissé entendre que quatre autres racks – 61Bxx, 61Cxx, 62Bxx et 62Cxx – ont été gravement endommagés par l'incendie. La restauration du SBG3, qui compte cinq étages, pourrait également être retardée. Les trois étages inférieurs sont apparemment en bon état, mais le quatrième étage a "quelques problèmes" et le dernier étage est endommagé par la fumée.


Les onduleurs, batteries et fusibles sont désormais en la possession des assureurs et de la police pour la poursuite des enquêtes.

Source : Twitter Klaba

Et vous ?

Hébergez-vous des données ou sites sur OVHcloud ? Avez-vous été impacté par cet incendie ?
Quelles précautions prenez-vous en plus de la souscription à une offre de hosting ? Quelle est votre approche personnelle en matière de gestion de sauvegardes ?

Voir aussi :

OVHcloud lance le processus d'une éventuelle introduction en bourse selon un porte-parole de l'entreprise
Capgemini et OVHcloud signent un partenariat mondial pour permettre aux organisations de mener leur transformation dans le cloud de manière sécurisée et apporter des solutions cloud robustes
OVHcloud s'associe à Orange Business Services afin d'accompagner les projets de migration et de transformation vers le cloud OVHcloud dans « une approche multifournisseur »
OVHcloud s'associe à IBM et Atempo pour offrir aux organisations européennes une solution de stockage dans le cloud souveraine et compétitive, partenariat basé sur les solutions de stockage sur bande

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de Patrick Ruiz
Chroniqueur Actualités https://www.developpez.com
Le 22/03/2021 à 17:37
OVH abandonne le datacenter SBG1 envahi par de la fumée provenant de batteries lors du nouvel incendie maîtrisé :
le résultat d’erreurs de conception de l’alimentation électrique révélées en 2017 ?

Dizaine difficile pour OVH lancé dans la gestion d’un incendie qui lui a valu la perte du datacenter dénommé SBG2 sur son site de Strasbourg. En effet, l’addition est désormais plus salée pour le leader français et espoir européen de l’hébergement web. L’entreprise a frôlé un nouvel incendie et décide y faisant suite de l’abandon du datacenter SBG1. Qu’est-ce qui explique cette série de départs en fumée ? La piste de l’erreur de conception de l’alimentation électrique n’est-elle pas à explorer ?

La fumée dans le datacenter SBG1 provenait d’un lot de 300 batteries stockées en son sein dans un local non utilisé. Dans la foulée, OVHCloud a annoncé que tous les serveurs SBG1 seraient finalement déplacés sur d'autres centres de données situés sur le site de Strasbourg ou sur ses campus de Gravelines et Roubaix. L’entreprise avait pointé du doigt un dysfonctionnement d’un onduleur comme cause de l’incendie qui a détruit le datacenter SBG2. À date, 60 % des VPS de SBG3 sont en principe fonctionnels, contre 25 % pour l'offre bare metal. On reste dans l’attente de 40 % de Private Cloud (pCC). Le travail se poursuit. Il en va de même pour SBG4, avec le redémarrage attendu pour ce mercredi 24 mars.


La piste de l’erreur de conception de l’alimentation électrique du site est-elle à exclure ?

Dans une mise à jour de gestion d’incident survenu en 2017 Octave Klaba explique que :

« Ce matin à 7 h 23, nous avons eu une panne majeure sur notre site de Strasbourg (SBG) : une coupure électrique qui a mis dans le noir nos trois datacentres SBG1, SBG2 et SBG4 durant 3h30. Le pire scénario qui puisse nous arriver.

« Le site de SBG est alimenté par une ligne électrique de 20 kV composée de deux câbles qui délivrent chacun 10 MVA. Les deux câbles fonctionnent ensemble, et sont connectés à la même source et sur le même disjoncteur chez ELD (Strasbourg Électricité Réseaux). Ce matin, l’un des deux câbles a été endommagé et le disjoncteur a coupé l’alimentation des datacentres.

« Le site SBG est prévu pour fonctionner, sans limite de temps, sur les groupes électrogènes. Pour SBG1 et SBG4, nous avons mis en place, un premier système de deux groupes électrogènes de 2 MVA chacun, configurés en N+1 et en 20 kV. Pour SBG2, nous avons mis en place trois groupes en N+1 de 1.4MVA chacun. En cas de coupure de la source externe, les cellules haute tension sont reconfigurées automatiquement par un système de bascule motorisé. En moins de 30 secondes, les datacentres SBG1, SBG2 et SBG4 sont réalimentés en 20 KV. Pour permettre toutes ces bascules sans couper l’alimentation électrique des serveurs, nous disposons d’onduleurs (UPS) sachant fonctionner sans aucune alimentation durant huit minutes.

« Ce matin, le système de basculement motorisé n’a pas fonctionné. L’ordre de démarrage des groupes n’a pas été donné par l’automate. Il s’agit d’un automate NSM (Normal Secours Motorisé), fournit par l’équipementier des cellules haute-tension 20 kV. Nous sommes en contact avec lui, afin de comprendre l’origine de ce dysfonctionnement. C’est toutefois un défaut qui aurait dû être détecté lors des tests périodiques de simulation de défaut sur la source externe. Le dernier test de reprise de SBG sur les groupes date de la fin du mois mai 2017. Durant ce dernier test, nous avons alimenté SBG uniquement à partir des groupes électrogènes durant 8H sans aucun souci et chaque mois nous testons les groupes à vide. Et malgré tout, l’ensemble de ce dispositif n’a pas suffi aujourd’hui pour éviter cette panne.

« Vers 10h, nous avons réussi à basculer les cellules manuellement et nous avons recommencé à alimenter le datacentre à partir des groupes électrogènes. Nous avons demandé à ELD de bien vouloir déconnecter le câble défectueux des cellules haute tension et remettre le disjoncteur en marche avec un seul des deux câbles, et donc limité à 10 MVA. La manipulation a été effectuée par ELD et le site a été réalimenté vers 10 h 30. Les routeurs de SBG ont été joignables à partir de 10 h 58.

« Depuis, nous travaillons, sur la remise en route des services. Alimenter le site en énergie permet de faire redémarrer les serveurs, mais il reste à remettre en marche les services qui tournent sur les serveurs. C’est pourquoi chaque service revient progressivement depuis 10 h 58. Notre système de monitoring nous permet de connaitre la liste de serveurs qui ont démarré avec succès et ceux qui ont encore un problème. Nous intervenons sur chacun de ces serveurs pour identifier et résoudre le problème qui l’empêche de redémarrer.

« À 7 h 50, nous avons mis en place une cellule de crise à RBX, où nous avons centralisé les informations et les actions de l’ensemble des équipes. Un camion en partance de RBX a été chargé de pièces de rechange pour SBG. Il est arrivé à destination vers 17 h 30. Nos équipes locales ont été renforcées par des équipes du datacentre de LIM en Allemagne et de RBX, ils sont tous mobilisés sur place depuis 16H00. Actuellement, plus de 50 techniciens travaillent à SBG pour remettre tous les services en route. Nous préparons les travaux de cette nuit et, si cela était nécessaire, de demain matin.

« Prenons du recul. Pour éviter un scénario catastrophe de ce type, durant ces 18 dernières années, OVH a développé des architectures électriques capables de résister à toutes sortes d’incidents électriques. Chaque test, chaque petit défaut, chaque nouvelle idée a enrichi notre expérience, ce qui nous permet de bâtir aujourd’hui des datacentres fiables.

« Alors pourquoi cette panne ? Pourquoi SBG n’a pas résisté à une simple coupure électrique d’ELD ? Pourquoi toute l’intelligence que nous avons développée chez OVH, n’a pas permis d’éviter cette panne ?

« La réponse rapide : le réseau électrique de SBG a hérité des imperfections de design liées à la faible ambition initialement prévue pour le site.

« La réponse longue :

En 2011, nous avons planifié le déploiement de nouveaux datacentres en Europe. Pour tester l’appétence de chaque marché, avec de nouvelles villes et de nouveaux pays, nous avons imaginé une nouvelle technologie de déploiement de datacentres, basée sur les containers maritimes. Grâce à cette technologie, développée en interne, nous avons voulu avoir la souplesse de déployer un datacentre sans les contraintes de temps liées aux permis de construire. À l’origine, nous voulions avoir la possibilité de valider nos hypothèses avant d’investir durablement dans un site.

« C’est comme ça que début 2012, nous avons lancé SBG avec un datacentre en containers maritimes : SBG1. Nous avons déployé huit containers maritimes et SBG1 a été opérationnel en seulement deux mois. Grâce à ce déploiement ultra rapide, en moins de 6 mois nous avons pu valider que SBG est effectivement un site stratégique pour OVH. Fin 2012, nous avons décidé de construire SBG2 et en 2016, nous avons lancé la construction de SBG3. Ces deux constructions n’ont pas été faites en containers, mais ont été basées sur notre technologie de « Tour » : la construction de SBG2 a pris neuf mois et SBG3 sera mis en production dans un mois. Pour pallier les problèmes de place début 2013, nous avons construit très rapidement SBG4, l’extension basée encore sur les fameux containers maritimes.

« Le problème est qu’en déployant SBG1 avec la technologie basée sur les containers maritimes, nous n’avons pas préparé le site au large scale. Nous avons fait deux erreurs : primo, nous n’avons pas remis le site SBG aux normes internes qui prévoient deux arrivées électriques indépendantes de 20*KV, comme tous nos sites de DC qui possèdent plusieurs doubles arrivées électriques. Il s’agit d’un investissement important d’environ 2 à 3 millions d’euros par arrivée électrique, mais nous estimons que cela fait partie de notre norme interne. Deuxio, nous avons construit le réseau électrique de SBG2 en le posant sur le réseau électrique de SBG1, au lieu de les rendre indépendants l’un de l’autre, comme dans tous nos datacentres. Chez OVH, chaque numéro de datacentre veut dire que le réseau électrique est indépendant d’un autre datacentre. Partout sauf sur le site de SBG.

« La technologie basée sur les containers maritimes n’a été utilisée que pour construire SBG1 et SBG4. En effet, nous avons réalisé que le datacentre en containers n’est pas adapté aux exigences de notre métier. Avec la vitesse de croissance de SBG, la taille minimale d’un site est forcément de plusieurs datacentres, et donc d’une capacité totale de 200*000 serveurs. C’est pourquoi, aujourd’hui, pour déployer un nouveau datacenter, nous n’utilisons plus que deux types de conceptions largement éprouvées et prévues pour le large scale avec de la fiabilité : la construction de tours de cinq ou six étages (RBX4, SBG2-3, BHS1-2), pour 40*000 serveurs ; l’achat des bâtiments (RBX1-3,5-7, P19, GRA1-2, LIM1, ERI1, WAW1, BHS3-7, VIH1, HIL1) pour 40 000 ou 80 000 serveurs.

« Même si l’incident de ce matin a été causé par un automate tiers, nous ne pouvons nous dédouaner de la responsabilité de la panne. À cause du déploiement initial basé sur les containers maritimes, nous avons un historique à rattraper sur SBG pour atteindre le même niveau de normes que sur les autres sites d’OVH.

« Cet après-midi, nous avons décidé du plan d’action suivant : la mise en place de la 2e arrivée électrique, totalement séparée, de 20 MVA ; la séparation du réseau électrique de SBG2 vis-à-vis de SBG1/SBG4, ainsi que la séparation du futur SBG3 vis-à-vis de SBG2 et SBG1/SBG4 ; la migration des clients de SBG1/SBG4 vers SBG3 ; la fermeture de SBG1/SBG4 et la désinstallation des containers maritimes.

« Il s’agit d’un plan d’investissement de 4-5 millions d’euros, que nous mettons en route dès demain, et qui, nous l’espérons, nous permettra de restaurer la confiance de nos clients envers SBG et plus largement OVH.

« Les équipes sont toujours en train de travailler sur la remise en route des derniers clients impactés. Une fois l’incident clos, nous appliquerons les SLA prévus dans nos contrats.

« Nous sommes profondément désolés pour la panne générée et nous vous remercions des encouragements que vous nous témoignez durant cet incident. »

La Cnil monte au créneau

La CNIL a pour sa part procédé à la publication d’ une note sur son site qui rappelle les règles du RGPD aux propriétaires des sites web affectés par les incidents OVH. S'ils ont perdu des données personnelles, il faut le signaler à l'autorité :

« Suite à l’incendie du 10 mars 2021 ayant eu lieu dans un centre de données d’OVH à Strasbourg, la CNIL rappelle les obligations en matière de notification de violation en cas d’indisponibilité ou de destruction de données personnelles. La destruction de données personnelles (temporaire ou définitive), y compris accidentelle, constitue une violation de données au sens du RGPD. À ce titre, les responsables de traitement qui hébergeaient des données personnelles au sein des infrastructures touchées doivent documenter la violation (les faits, ses effets et les mesures prises pour y remédier) dans un registre tenu en interne. Les sous-traitants doivent informer leurs clients de l'incident afin que ces derniers puissent remplir leurs propres obligations, dont celle de documentation dans le registre des violations tenu en interne par chacun d’entre eux. »

Sources : Twitter, Cnil

Et vous ?

Qu’en pensez-vous ?

Voir aussi :

OVHcloud lance le processus d'une éventuelle introduction en bourse selon un porte-parole de l'entreprise
Capgemini et OVHcloud signent un partenariat mondial pour permettre aux organisations de mener leur transformation dans le cloud de manière sécurisée et apporter des solutions cloud robustes
OVHcloud s'associe à Orange Business Services afin d'accompagner les projets de migration et de transformation vers le cloud OVHcloud dans «*une approche multifournisseur »
OVHcloud s'associe à IBM et Atempo pour offrir aux organisations européennes une solution de stockage dans le cloud souveraine et compétitive, partenariat basé sur les solutions de stockage sur bande
13  0 
Avatar de Stéphane le calme
Chroniqueur Actualités https://www.developpez.com
Le 30/03/2021 à 10:05
OVH donne des informations relatives au nettoyage des équipements suite à l'incendie,
opération nécessaire avant une remise en service

L'opérateur de cloud français OVH a révélé comment il nettoie tous les serveurs qui, selon lui, peuvent être remis en service dans ses centres de données brulés à Strasbourg. Le fondateur et président Octave Klaba a utilisé son compte Twitter pour montrer une partie du travail effectué par l'équipe de nettoyage de l'entreprise.

« Le nettoyage prend du temps. Nous avons 80 personnes (SBG3) + 20 personnes (Croix). Sur la gauche, une carte mère avec la pollution par la fumée sur le socket du CPU. C'est très corrosif ! Si nous mettons sous tension, il est mort. Identique au disque. Sur la droite, le même appareil 24 h après le nettoyage ».


Klaba a également déclaré que tous les serveurs devraient être nettoyés d'ici mardi, mais que le stockage et l'empilage de l'infrastructure pour certains services prennent plus de temps que prévu.

La mise à jour du dimanche après-midi d'OVH a offert plus de détails : « Aujourd'hui, le temps de nettoyage d'un rack est de 7 heures, et nos équipes s'améliorent chaque jour ».

La mise à jour avait également de meilleures nouvelles pour les clients :
  • SBG1 : Les serveurs récupérables Bare Metal Cloud sont en cours de nettoyage pour réinstallation à Strasbourg (SBG3 et SBG4). La remise en service débutera progressivement au début de la semaine prochaine (après inspection et nettoyage).
  • SBG3 est opérationnel : 84 % des services Bare Metal Cloud (VPS) ont de nouveau été mis à la disposition des clients, avec un objectif de 90 % au soir du 28 mars.
  • SBG4 est opérationnel : 100 % des serveurs Bare Metal sont à la disposition des clients.

Les serveurs du centre de données SBG1 reviendront en ligne à des moments différents. Certains resteront à Strasbourg et logeront au SBG4. D'autres sont destinés à d'autres centres de données OVH. La mise à jour mentionne un redémarrage « en milieu de semaine du 29 mars » pour certains et un redémarrage le 1er ou le 2 avril pour ceux qui ont été déplacés vers d'autres emplacements.

La reprise après sinistre est également en cours.

Certains services cloud d'OVH ne sont pas non plus restaurés à 100% de disponibilité. La société a également averti que des niveaux élevés de demande signifient que « les délais de livraison de nos services Bare Metal Cloud peuvent prendre plus de temps que d'habitude ».

« Nos équipes sont pleinement mobilisées et nous travaillons d'arrache-pied pour livrer le plus rapidement possible à nos clients, en particulier à tous les clients concernés », indique le communiqué de dimanche.

Klaba, quant à lui, a révélé que l'incendie avait coûté à OVH l'opportunité de lancer un nouveau service.

Sources : OVH, Octave Klaba

Et vous ?

Hébergez-vous des données ou sites sur OVHcloud ? Avez-vous été impactés par cet incendie ?
Si oui, faites-vous partie des clients dont les services ont été restaurés ?

Voir aussi :

OVHcloud lance le processus d'une éventuelle introduction en bourse selon un porte-parole de l'entreprise
Capgemini et OVHcloud signent un partenariat mondial pour permettre aux organisations de mener leur transformation dans le cloud de manière sécurisée et apporter des solutions cloud robustes
OVHcloud s'associe à Orange Business Services afin d'accompagner les projets de migration et de transformation vers le cloud OVHcloud dans « une approche multifournisseur »
OVHcloud s'associe à IBM et Atempo pour offrir aux organisations européennes une solution de stockage dans le cloud souveraine et compétitive, partenariat basé sur les solutions de stockage sur bande
12  0 
Avatar de Fleur en plastique
Membre averti https://www.developpez.com
Le 24/03/2021 à 10:47
Je suis tout feu tout flamme !

C'est vraiment des bandes de branquignoles, là on peut dire que leur réputation a cramé, que la confiance est partie en fumée, mais le feu de la catastrophe à venir devait couver depuis longtemps. Il a fallu que les flammes du destin viennent consumer le clair manque de sécurité de leurs datacentres. OVH sur le coup, a fait long feu, et leur aura de premier hébergeur de France est en cendres. Il est certain qu'il leur faudra des années à OVH pour faire des étincelles à nouveau.

Pour mon expérience personnelle : j'exploite un serveur situé sur le datacentre SBG1, dans l'une des salles qui a échappée au premier feu. Le serveur a été rallumé 7 jours après l'incident, mais mis en mode rescue, obligeant du coup à une opération manuelle pour le mettre en mode normal. Mais le robot de reboot était HS, il a donc fallu attendre qu'ils soit réparé pour que je puisse le relancer en mode normal. OVH a envoyé deux mails de condoléances dans les jours qui suivaient l'incident, a prévenu du démarrage du serveur en mode secours. Mais depuis, plus rien. D'ailleurs, le serveur est à nouveau HS, probablement suite au déménagement prochain vers un datacentre non maudit ? En tant que cliente, je n'en ai pas la moindre idée.

Je pensais les incendier au téléphone. J'ai été mise en attente pendant très exactement 59 minutes, m'assurant qu'un opérateur allait prendre mon appel. Mais au final, on m'a juste raccroché au nez. J'étais verte.
12  2 
Avatar de Stan Adkens
Chroniqueur Actualités https://www.developpez.com
Le 06/05/2021 à 19:33
OVH présente un plan « Hyper résilience » en 3 points après l'incendie qui a détruit les serveurs et les sauvegardes,
Mais ne révélera pas la cause du désastreux incident avant 2022

Le fournisseur français de services de Cloud Computing OVH a présenté un plan en trois points conçu pour éviter une répétition de la perte de données et de services résultant de l'incendie qui a ravagé ses opérations à Strasbourg le 10 mars. Baptisé "Hyper résilience", ce plan combine une approche remaniée des sauvegardes internes, des sauvegardes externes des clients et une nouvelle politique de basculement entre trois centres de données par région. Dans une allocution vidéo diffusée sur Twitter le mardi, le PDG d'OVHcloud a également présenté ses excuses aux clients. Mais pour ceux qui attendent de connaître maintenant les raisons de l’incendie, OVH ne les révélera pas avant l’année prochaine.

L'incendie, qui a eu lieu le 10 mars, a détruit le hall SBG2 du centre de données de Strasbourg, a gravement endommagé le SBG1 et a entraîné un effort massif de nettoyage des équipements récupérables afin qu'ils puissent être installés dans les trois autres centres de données de Strasbourg ou déplacés vers d'autres installations OVH. Heureusement, personne n'a été blessé.


Dans une vidéo publiée sur Twitter, 50 jours après l'incident, Michel Paulin, directeur général d'OVHcloud, a présenté ses excuses aux clients. Il a également salué les efforts des équipes de récupération d'OVHcloud. Dans la même vidéo, Octave Klaba, président et fondateur d'OVHcloud, a promis de mettre en place une infrastructure de centre de données résiliente, la décrivant en termes similaires aux zones de disponibilité déjà utilisées par les principaux services de Cloud Computing Amazon, Azure et Google.

Klaba a déclaré qu'il soupçonnait deux unités d'alimentation sans coupure d'être à l'origine de l'incendie, révélant que les onduleurs, les batteries et les fusibles sont entre les mains de la police et des assureurs. Le 14 avril dernier, alors qu’OVH s'efforçait toujours de remettre en ligne tous les clients touchés par l'incendie, Klaba a décrit la situation comme un « véritable cauchemar ».

Le plan « Hyper résilience »

Lors de son intervention dans la courte vidéo, le fondateur d'OVH a promis que la société avait un « plan stratégique d'hyper résilience pour les cinq prochaines années » qui donnerait aux clients des sauvegardes gratuites et une infrastructure résiliente. OVHcloud a promis de publier plus de détails sur l'infrastructure la semaine prochaine.

Le plan d’OVH commence par les sauvegardes internes. « Bien sûr, OVH dispose de sauvegardes internes pour tous les services, pour nos besoins internes », a déclaré Klaba. « Et nous avons décidé de mettre à niveau la façon dont nous effectuons les sauvegardes internes ». Certaines sauvegardes étaient dans le même centre de données, tandis que d'autres étaient dans des centres de données distants. L'opérateur propose désormais de créer une région de quatre centres de données où il hébergera des sauvegardes internes physiquement séparées des régions opérationnelles.

À l'avenir, a-t-il dit, « nous allons créer une région avec quatre centres de données en dehors de tous nos centres de données. Et c'est là que nous placerons toutes les sauvegardes internes. Ce sera donc totalement en dehors de tous nos centres de données dans une autre région ».

Ensuite, OVH ajoutera des fonctionnalités aux sauvegardes dans la nouvelle région. Alors que les données de sauvegarde répondaient jusqu'à présent à ses besoins internes, OVH propose que les clients puissent répliquer et supprimer les données de sauvegarde pour leurs propres besoins dans le cadre d'un service gratuit. « Nous voulons être considérés comme l'expert de la sauvegarde », a dit le fondateur.

Enfin, OVH a indiqué qu'il allait modifier les règles internes relatives à la construction des centres de données ainsi qu'à la résilience gérée par logiciel et fonctionnant dans trois centres de données d'une même région, en commençant par Paris, avant d'être introduit dans le reste de l'Europe, aux États-Unis et en Asie. Toutefois, les détails de cette infrastructure résiliente ont été reportés à un communiqué de presse prévu pour la semaine prochaine.

OVHcloud a restauré 118 000 des 120 000 services clients touchés par l'incendie, a déclaré Paulin, donnant des détails sur l'effort de restauration : « Nous avons été en mesure de produire jusqu'à 16 000 serveurs pour pouvoir restaurer les services, et nous avions jusqu'à 200 personnes sur le site. Maintenant, nous avons encore 100 personnes sur place ».

Paulin a déclaré qu'OVHcloud veut « répondre à chaque client un par un », et a renforcé ses équipes de soutien pour traiter les questions commerciales, techniques et de facturation ; ainsi que la mise en place d'une équipe dédiée à la communication sur les médias sociaux.


Klaba a fait un vœu similaire concernant la modernisation du campus après une panne massive en 2017. À l'époque, le groupe s'était lancé dans un « plan d'investissement de 4 à 5 millions d'euros à la suite d'une panne majeure qui a privé trois des centres de données de Strasbourg – SBG1, SBG2 et SBG4 – de courant pendant 3,5 heures en novembre 2017 ».

Klaba lui-même a déclaré à l'époque de la panne de 2017 qu'elle était en partie due au fait que « le réseau électrique de SBG a hérité de tous les défauts de conception qui étaient le résultat des petites ambitions initialement prévues pour ce site – avec le réseau électrique de SBG2 construit au-dessus du réseau électrique de SBG1 au lieu de les rendre indépendants l'un de l'autre ».

OVH n’est pas en mesure de révéler la cause de l’incendie avant 2022

Après l'incendie de mars 2021, Klaba a déclaré qu'OVH allait reconstruire les centres de données touchés par l'incendie : Strasbourg 1, 2 et 4. Mais « En ce qui concerne la cause sous-jacente de l'incendie, je prévois que les informations officielles ne seront pas divulguées avant l'année prochaine », a déclaré un porte-parole d'OVHcloud en réponse à la demande de clarification de Data Center Dynamics après la publication de la vidéo d'OVHcloud mardi, expliquant que c'était en raison de « l'implication des autorités françaises, des compagnies d'assurance, etc. ».

Les rapports de pannes peuvent prendre du temps, mais 10 mois, c'est long. Le gouvernement de Singapour a été impliqué dans les enquêtes lors de la défaillance de novembre 2017, qui a provoqué une panne de trois heures à la bourse de Singapour (SGX) – mais le rapport a été remis à la SGX en quatre mois (au mois de mars suivant), et publié en juin. Le retard jusqu'à l'année prochaine pourrait avoir un impact sérieux sur les plans d'OVHcloud d'avoir une introduction en bourse plus tard cette année, selon DCD.

Cette précédente mise à niveau aurait impliqué la « désinstallation de conteneurs maritimes » (conteneurs d'expédition) et d'importants travaux électriques.

Alors qu'OVHcloud continue à travailler pour restaurer les services, les critiques s'accumulent dans la communauté technique française. Un article paru dans VO News accuse OVHcloud d'avoir commis une série d' « erreurs grossières », telles que le manque d’indépendance de SBG4, ce dernier tirant son énergie du même circuit que SBG2. En outre, SBG2 ne disposait pas de sa propre salle réseau. Les critiques reprochent aussi à OVH d’avoir des planchers du centre de données de cinq étages de SBG2 en bois. OVHcloud ne dispose également pas d'un système d'extinction automatique d'incendie.

« Les responsables devront tirer les conséquences de tant d'erreurs accumulées », indiquait l'article. « Vouloir vendre au plus bas prix est un fait, ne pas prendre de mesures responsables pour assurer un minimum de sécurité est une erreur stratégique qui leur est totalement imputable, et certains clients qui ont tout perdu vont le leur faire payer très cher ».

« Nous sommes vraiment désolés pour ce qui s'est passé à Strasbourg », a déclaré Paulin dans la vidéo, avant de faire l'éloge de ses collègues : « Je tiens également à remercier les équipes. Elles ont travaillé, nuit et jour pour pouvoir rétablir, le plus rapidement possible, tous nos services ». En mars, OVHcloud a promis de créer un laboratoire de simulation des incendies de datacenters pour mieux les modéliser et trouver des moyens plus efficaces de les éteindre.

Source : Vidéo d’OVH

Et vous ?

Que pensez-vous de l’allocution d’OVH sur Twitter ?
Quel est votre avis sur le plan "Hyper résilience" du fournisseur de service Cloud ?
OVHcloud ne révélera pas la cause de l’incendie avant 2022. Quels commentaires faites-vous des raisons de ce retard ?

Voir aussi :

OVHcloud : Octave Klaba annonce l'adoption d'une nouvelle politique de sauvegarde gratuite des données de tous les clients, et la remise à la police des onduleurs et batteries détruits par l'incendie
OVHcloud promet de créer un laboratoire de simulation des incendies de datacenters, pour mieux les modéliser et trouver des moyens plus efficaces de les éteindre
Incendie OVH : plus d'un millier de sauvegardes ne seront probablement pas récupérables, admet OVHcloud
OVHcloud s'associe à IBM et Atempo pour offrir aux organisations européennes une solution de stockage dans le cloud souveraine et compétitive, partenariat basé sur les solutions de stockage sur bande
10  0 
Avatar de GAYOT
Rédacteur/Modérateur https://www.developpez.com
Le 18/03/2021 à 12:12
Citation Envoyé par pebaroiller Voir le message
Moi ce qui me fait halluciner , c'est tous ces "soi-disant" professionnels qui depuis 1 semaine sont là à pleurer parce que leur serveur est mort !
pas de sauvegarde ... pas de plan de secours ... pourtant c'est un minimum !!!
Attention. Il n'y a pas que des professionnels pseudos ou non. Il y a plein de petites associations de bénévoles, qui n'ont pas de connaissance particulière en informatique et dont les moyens souvent très limités ne permettent pas d'avoir des solutions plus pérennes.... C'est le système D et la formation sur le tas qui prévalent ... et parfois le tas est semé d'embuches.
9  0 
Avatar de chrtophe
Responsable Systèmes https://www.developpez.com
Le 18/03/2021 à 23:24
Hébergez-vous des données ou sites sur OVHcloud ? Avez-vous été impactés par cet incendie ?
Peu, surtout les boites mails inaccessibles pendant une journée pour beaucoup de client ou un retard d'acheminement. Les offres grand-publics avec petits sites simples (en mutualisé) ont été peu impactés, du moins de ce que j'en ai vu. Quelques site peu importants tombés non gérés par moi, car hébergés par de petites agences qui louent un serveur pour héberger les sites de plusieurs clients.

Je ne connais pas OVH mais est-ce que leur communication (et celle des revendeur) est clair sur la nécessité de faire des sauvegardes et la possibilité réel de perdre des données et ce que ces options sont mises en avant comme sur Azure par exemple ?
Tu as 2 parties chez OVH, les offres grand-public et les offres professionnelles. Sur les offres grand-publics type mutualisés, tu peux restaurer facilement la base jusque J-30 et le contenu FTP à J-2,J-2, J-3,1 semaine, 2 semaines, mais c'est non contractuel, précisé dans les CGV, cela sur une offre qui coute par exemple 45 € par an soit moins de 4€ par mois, avec 100 go d'espace disque, 4 sites web possible, 1 base de données de 200 Mo. Très bien pour une petite asso, certainement pas suffisant pour un site marchand Pour la partie offres VPS, serveurs dédiés, etc. tu as des offres de backup, tu peux redonder sur d'autres datacenters, mais là t'es plus dans la même cour : pour le private cloud c'est du VMWare avec des offres de par exemple 2 hôtes avec 48 Go de RAM et 12 coeurs pour 1200 € par mois voire 1500 € pour du certifié HDS. Et à ce prix là tu peux à mon avis choisir ton datacenter et donc stocker 2 hôtes dans 2 datacenters différents.

Le problème est qu'aussi beaucoup de gens ici qui bavent sur OVH n'ont jamais mis un pieds dans un de leurs DATACENTER, et ne connaissent absolument pas les mesures anti-incendie qui étaient en place (ou pas)
Ce qui leur serait reprochable, si c'est avéré, c'est la présence d'une salle de backup contigüe à une salle de serveurs pour les mêmes données, de ce que j'ai cru comprendre. Mais sur le type d'offre concerné, on est censé avoir suffisamment d'autonomie pour comprendre et être capable d'avoir une sauvegarde fiable ailleurs (on peut envisager une sauvegarde au même endroit sous réserve qu'il y en ai au moins une autre ailleurs), voire une redondance automatique pour une totale résilience sans interruption, mais effectivement ça commence à couter. Et là je ne sais pas si on parle de backup contractuel ou non.

Incendie d’OVHcloud : une Normande perd son site Internet et se voit proposer 30 euros de dédommagement, après avoir subi un préjudice estimé à 2000 euros
Il ne lui a pas été proposé 30 euros de dédommagement mais 6 mois gratuit, c'est pas la même chose. Ca veut dire qu'elle paye normalement 5 euros par mois. Elle estime subir un préjudice de 2000 euros si le site repart en une semaine. Ca fait donc un chiffre d'affaires de 8000 € par mois, et elle ne met que 5€ par mois dans le site ? Un petit peu plus de dépenses pour au moins un backup pour quelques euros de plus... mais elle a peut-être mal été conseillée. Elle peut heureusement compter sur son conjoint qui s'y connait en développement, mais qui n'a semble t'il pas choisi la formule adequat avec sauvegarde pour l'hebergement.
9  0 
Avatar de Stéphane le calme
Chroniqueur Actualités https://www.developpez.com
Le 02/04/2021 à 9:31
Incendie OVH : plus d’un millier de sauvegardes ne seront probablement pas récupérables,
admet OVHcloud

C'est sur twitter qu'Octave Klaba, fondateur et président d'OVH, a annoncé l'évolution des travaux de son entreprise. Cette fois-ci, une mauvaise nouvelle pour certains de ses clients : ils ne seront pas en mesure de récupérer leurs sauvegardes.

Le problème se situe au niveau de l’option payante de backup automatisé pour les VPS et les instances Public Cloud (PCI). Elle dépend du service de stockage objet (PCS). Ce dernier se trouvait dans le datacenter SBG3 à 99,5 %. Le reste était hébergé dans SBG2, que l’incendie a détruit. Est alors étudiée la possibilité de reconstituer les données. Étant donné que les fichiers sont chiffrés, l'exercice s'avère impossible s'il manque ne serait-ce qu'une infime partie. C'est le cas pour 1235 sur 19 486 sauvegardes. Octave Klaba explique :

« 0,5 % des serveurs ont été détruits. Nous avons vérifié et reconstruit les données, mais nous ne pouvons pas récupérer toutes les données. Il s’agit d’une petite partie ; nous n'avons pas trois copies puisque les trois copies étaient sur 0,5 % des serveurs. Des 1 235 sauvegardes sur 19 486 sauvegardes, 6 %, soit une petite partie du fichier, n’y sont pas. Étant donné que tous les fichiers sont chiffrés, nous ne pouvons pas reconstruire partiellement les 1 235 sauvegardes avec les données dont nous disposons. Nous continuons à vérifier, mais ..: /

« Toutes les 18 251 sauvegardes (VPS / PCI) sont en cours ».


Concernant les sauvegardes valides, la remise en service VPS a débuté ce jeudi 1er avril. OVHcloud compte les fournir « prêts à l’emploi » à partir de la dernière sauvegarde. Toutefois, l'hébergeur prévient que la récupération est susceptible de durer plusieurs jours. Pour mémoire, un serveur privé virtuel (VPS, pour Virtual Private Server) est un serveur dédié virtualisé. Contrairement à un hébergement web (dit mutualisé) où la gestion technique est prise en charge par OVHcloud, c'est vous qui administrez totalement votre VPS.

Au tweet « Ils sont probablement en train de créer un script qui pourra reconstruire les VPS à l'identique en termes d'IP et de configuration similaire et qui y remontera le dernier backup disponible (la veille de l'incendie donc), plus rapide (sur la totalité) et fiable que manuellement », OVHcloud Task Force Tech a répondu : « C'est ça, l'idée est de pouvoir reconstruire les VPS de SBG2 qui avaient des backups automatiques à partir du dernier backup, de la façon la plus rapide et industrialisée possible ».

Sur l’offre PCI, la mise à disposition des backups a démarré ce 31 mars dans une nouvelle région OpenStack. Il revient aux clients de recréer des instances à partir du manager ou de l’API.

Concernant la récupération des serveurs, OVHCloud a fait une mise à jour. Conformément à sa politique de transparence vis-à-vis de ses clients, l'entreprise a communiqué sur ses plans d'action en cours. Voici la situation actuelle :
  • SBG1 : les serveurs de SBG1 sont inspectés, nettoyés et éventuellement réparés à Croix. Certains ont été renvoyés sur le site de Strasbourg et sont en cours de reconnexion. Les premiers racks sont en service depuis jeudi 1er avril. Les opérations se poursuivront pendant une semaine. Le site SBG1 est en cours de démantèlement.
  • SBG 2 : des services équivalents dans d'autres datacenters sont proposés à tous ses clients, et OVH les accompagne par des solutions alternatives.
  • SBG3 est opérationnel : à ce jour, 95 % des services VPS et 99 % des services Bare Metal Cloud, Public Cloud Instance et Public Cloud Storage ont été mis à disposition des clients. Le service vRack a également été restauré.
  • Il y a eu un dysfonctionnement sur l'équipement énergétique du SBG3 jeudi 1er avril aujourd'hui vers 6 heures du matin, sans conséquence sur le service. Ses équipes ont mis en place les contrôles nécessaires et poursuivi les opérations sur site.
  • SBG4 est opérationnel : 100% des serveurs Bare Metal Cloud sont à la disposition des clients.

Sources : Octave Klaba, OVH

Et vous ?

Hébergez-vous des données ou sites sur OVHcloud ? Avez-vous été impacté par cet incendie ?
Si oui, faites-vous partie des clients dont les services ont été restaurés ?

Voir aussi :

OVHcloud lance le processus d'une éventuelle introduction en bourse selon un porte-parole de l'entreprise
Capgemini et OVHcloud signent un partenariat mondial pour permettre aux organisations de mener leur transformation dans le cloud de manière sécurisée et apporter des solutions cloud robustes
OVHcloud s'associe à Orange Business Services afin d'accompagner les projets de migration et de transformation vers le cloud OVHcloud dans « une approche multifournisseur »
OVHcloud s'associe à IBM et Atempo pour offrir aux organisations européennes une solution de stockage dans le cloud souveraine et compétitive, partenariat basé sur les solutions de stockage sur bande
9  0 
Avatar de Dominik94
Membre habitué https://www.developpez.com
Le 18/03/2021 à 3:11
Citation Envoyé par Mingolito Voir le message
Moi non, mais la majorité des gens oui se font abuser facilement par des apparences trompeuses, c'est un fait, il y a eu des millions de sites en panne, dont un grand nombre sont toujours en panne à ce jour, y compris des sites professionnels de sociétés.
Tu peux les traiter d'incompétents si ça te fais plaisir, mais il en reste pas moins que ce renommage total d'OVH en OVH cloud est trompeur, si Octave avait été professionnel et honnête il aurait séparé clairement son offre serveurs classique de son offre cloud, et pas faire passer des vessies pour des lanternes comme il l'a fait.
Qu'est-ce que le cloud computing ? la réponse de microsoft Azure https://azure.microsoft.com/fr-fr/ov...ting/#benefits
Le cloud computing simplifie la sauvegarde des données, la récupération d’urgence et la continuité des activités. Il rend ces activités moins coûteuses, car les données peuvent être mises en miroir sur plusieurs sites redondants au sein du réseau du fournisseur.
le "Il rend ces activités moins coûteuses", indique clairement que ça n'est pas d'origine dans les prestations.
Citation Envoyé par Mingolito Voir le message
Je connais une boite qui est en train de perdre 50 000 euros par jour et avec un site toujours en panne, et qui risque de déposer le bilan, donc oui peux être sont ils naïfs et incompétents mais quand même, cet 'OVH Cloud" de mes deux aura fait de sacrés dommages...
heu, avec 50 K€ de CA/jour, ils n'ont pas défini de plan de reprise d'activité ?
8  0 
Avatar de Levure
Membre du Club https://www.developpez.com
Le 24/03/2021 à 15:19
Donc en 2017, OVH annonce ceci :

« Cet après-midi, nous avons décidé du plan d’action suivant : la mise en place de la 2e arrivée électrique, totalement séparée, de 20 MVA ; la séparation du réseau électrique de SBG2 vis-à-vis de SBG1/SBG4, ainsi que la séparation du futur SBG3 vis-à-vis de SBG2 et SBG1/SBG4 ; la migration des clients de SBG1/SBG4 vers SBG3 ; la fermeture de SBG1/SBG4 et la désinstallation des containers maritimes.

« Il s’agit d’un plan d’investissement de 4-5 millions d’euros, que nous mettons en route dès demain, et qui, nous l’espérons, nous permettra de restaurer la confiance de nos clients envers SBG et plus largement OVH.
Et en 2021, rien n'a été apparemment fait :
  • Il n'y a toujours qu'une seule alimentation électrique pour l'ensemble du site de Strasbourg.
  • SBG1 et SBG4 sont toujours là. (Ce n'est que maintenant qu'ils vont fermer SBG1 et déplacer une partie des serveurs de SBG1 vers SBG4)


Pire, OVHCloud a annoncé qu'ils allaient alimenter SBG4 (électricité et réseau) à partir de SBG3.
Il n'y a aucune redondance sur le datacenter de Strasbourg, c'est effrayant. Le site de Strasbourg est clairement un site à éviter en l'état.

Et quand à la climatisation des salles via un refroidissement à eau, OVH n'a rien inventé : ça existe déjà chez Scaleway (DC5) : https://lafibre.info/scaleway/dc5/

Enfin, la dernière annonce d'OVHCloud de vouloir "faire évoluer les standards de protection" fait rire (jaune)...
Qu'ils implémentent déjà les principes de base existants de l'agencement et la gestion d'un datacenter et qu'ils soient plus transparents sur l'éventuel backup de leurs hébergements ainsi que leurs offres payantes de backup (réplications éventuelles et lieux de stockages des backups), ce sera déjà un énorme pas en avant...
..
OVHCloud c'est du low-cost, et le low-cost - il n'y a pas de magie - ca se fait toujours au détriment de l'un ou l'autre élément.
Je ne comprends pas comment on a pu reconnaître OVHcloud comme fournisseur de cloud souverain.
8  0 
Avatar de laloune
Membre éclairé https://www.developpez.com
Le 17/03/2021 à 16:02
Citation Envoyé par Uther Voir le message
Si tu ne te renseignes pas un minimum sur les garanties que propose l'offre que tu souscris, c'est entièrement ta faute.
+1

dans le cadre d'une utilisation professionnelle le coupable est aussi à chercher du coté, au choix : a/ de l'admin qui a pensé "Backup is for p***ies" b/ de celui qui finance et qui a voulu faire des économies de bouts de chandelle c/ du service juridique le cas échéant, qui n'est pas foutu de lire les contrats correctement
8  1