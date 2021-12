Amazon explique l'origine de la panne du 7 décembre et promet de mieux communiquer sur les incidents et leurs origines à l'avenir.

Amazon a expliqué l’origine de la panne sur ses Web Services qui a rendu inaccessible une partie du web pendant plusieurs heures le 7 décembre dernier et promis, dans le même temps, davantage de clarté si d’aventure cela devait arriver à nouveau. Comme CNBC le rapporte, Amazon a révélé qu’une fonctionnalité de mise à l’échelle automatique a entraîné un “comportement inattendu” de la part des clients réseaux internes. Les appareils qui connectaient ce réseau interne à AWS ont été surchargés, ce qui a fait coincer toutes les communications.

Amazon explique l’origine de la panne du 7 décembre

La nature même de cet incident a de fait empêché les équipes de mettre le doigt sur le problème et de le corriger, toujours selon le géant américain. Il aura fallu utiliser les logs pour découvrir ce qui est arrivé et nombre d’outils internes étaient aussi affectés. Les intervenants étaient “extrêmement circonspects” quant à la restauration des différents services pour éviter de casser tout ce qui fonctionnait encore. Ils ont dû lutter contre un “problème latent” qui empêcher les clients réseaux de se retirer et de donner aux systèmes une chance de se rétablir.

La division AWS a temporairement désactiver cette fonctionnalité de mise à l’échelle qui a causé le problème et ne la réactivera pas tant qu’une solution en bonne et due forme ne sera pas en place. Un correctif pour le bug latent arrivera dans les deux prochaines semaines, selon Amazon. Il y a par ailleurs une couche de configuration réseau supplémentaire pour protéger les appareils dans l’éventualité où cette panne devait se reproduire.

et promet de mieux communiquer sur les incidents et leurs origines à l’avenir

À noter, la prochaine fois qu’une telle panne devrait arriver, si cela doit arriver, vous devriez être mieux informé(e) sur le sujet. En effet, une nouvelle version du tableau de bord du status des services d’AWS devrait arriver en 2022 pour offrir une meilleure visualisation, et des explications, des différents soucis en cours, et un système d’aide multi-régions permettra d’aider Amazon à entrer en contact avec les clients plus facilement. Cela ne fera pas revenir les services AWS plus rapidement durant un incident, mais au moins, les clients pourront avoir des réponses à leurs interrogations, ce qui est très important quand les clients en question peuvent être Disney+ ou les aspirateurs Roomba.