Início AUTO Amazon revela causa da interrupção da AWS que deixou tudo off-line, desde...

Amazon revela causa da interrupção da AWS que deixou tudo off-line, desde bancos até camas inteligentes | Amazônia

8
0

A Amazon revelou que a causa da interrupção de horas da AWS desta semana, que deixou tudo off-line, desde Signal até camas inteligentes, foi um bug no software de automação que teve consequências de longo alcance.

EM uma longa visão geral No motivo da interrupção publicado na quinta-feira, a AWS revelou um conjunto contínuo de eventos que derrubaram milhares de sites e aplicativos hospedados nos serviços da empresa.

A AWS disse que os clientes não conseguiram se conectar ao DynamoDB, seu sistema de banco de dados onde os clientes da AWS armazenam, devido a “um defeito latente no sistema de gerenciamento automatizado de DNS (sistema de nomes de domínio) do serviço.

O DynamoDB mantém centenas de milhares de registros DNS. Ele usa automação para monitorar o sistema e garantir que os registros sejam atualizados com frequência para garantir que capacidade adicional seja adicionada conforme necessário, falhas de hardware sejam gerenciadas e o tráfego seja distribuído de forma eficiente.

A causa raiz do problema, disse a AWS, foi um registro DNS vazio para a região do data center US-East-1, com sede na Virgínia. O erro não pôde ser reparado automaticamente e exigiu intervenção manual do operador para ser corrigido.

A AWS disse que desativou o agendador DNS do DynamoDB e a automação do DNS Enator em todo o mundo, corrigindo as condições que levaram à interrupção e adicionando proteções adicionais.

Como resultado, o problema também causou interrupções em outras ferramentas da AWS.

Plataformas como Signal, Snapchat, Roblox, Duolingo, além de serviços como sites bancários e a empresa Ring Doorbell, estiveram entre as 2 mil empresas afetadas pela interrupção, segundo o Downdetector – site que monitora interrupções na Internet – com mais de 8,1 milhões de relatos de problemas de usuários em todo o mundo.

Embora os serviços tenham sido restaurados em poucas horas, o impacto da interrupção foi amplamente sentido.

Clientes de Oito sono – uma empresa de camas inteligentes que se conecta à Internet para controlar a temperatura e a inclinação da cama de uma pessoa – descobriu que não conseguia ajustar a cama ou a temperatura da cama durante a interrupção porque não conseguia se conectar à cama no aplicativo do telefone.

O CEO da empresa, Matteo Franceschetti, pediu desculpas clientes em X e esta semana lançou uma atualização em seus serviços que permitiria aos usuários controlar as funções críticas da cama via Bluetooth em caso de interrupção.

A doutora Suelette Dreyfus, professora de computação e sistemas de informação na Universidade de Melbourne, disse que as interrupções mostraram como o mundo era dependente de pontos únicos de falha na Internet.

“O único ponto não é apenas a AWS – eles são o maior fornecedor de nuvem com cerca de 30% do mercado – mas sim a nuvem como um todo, que é basicamente composta por apenas três empresas”, disse ela.

“A Internet foi projetada para ser resiliente; existiam muitos outros canais para contornar problemas ou ataques, mas perdemos parte dessa resiliência ao nos tornarmos tão dependentes de um punhado de empresas gigantes de tecnologia para fornecer não apenas armazenamento de dados, mas também hospedar serviços de dados.”

Source link

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui