Atualização 24/10: A Amazon compartilhou o seguinte: análise detalhada De acordo com o DownDetector, um dos incidentes que levou a uma interrupção massiva de mais de 2.000 serviços na segunda-feira, 20 de outubro, foi um problema no Sistema de Nomes de Domínio (DNS) que resultou em mais de 16 milhões de relatórios de clientes individuais em 60 países que estavam tendo problemas para acessar os serviços.
De acordo com a análise da Amazon, o problema ocorreu em seu maior cluster de data centers, o US-East-1. O incidente “resultou de uma falha potencial” no sistema DNS DynamoDB da marca, o que significa que ela não poderia mais compartilhar as informações necessárias para conectar os clientes.
Um sistema DNS funciona de maneira semelhante a uma lista telefônica, vinculando nomes de sites a endereços IP, permitindo o compartilhamento de informações entre serviços e clientes.
O bug original não foi reparado automaticamente, o que causou problemas em cascata em outras partes da plataforma AWS onde era generalizado. A marca aproveitou as análises para pedir desculpas a todos os clientes, dizendo “faremos tudo o que pudermos para aprender com este evento e usá-lo para melhorar a disponibilidade”.
A Amazon disse: “Embora tenhamos um forte histórico de operação de nossos serviços no mais alto nível de disponibilidade, reconhecemos o quão críticos são nossos serviços para nossos clientes, aplicativos, usuários finais e empresas. Reconhecemos que este incidente impactou muitos de nossos clientes de maneiras significativas”.
Atualização 21/10: Amazônia diz Todos os serviços da AWS “retornaram às operações normais” a partir de segunda-feira às 15h01, horário do Pacífico. Ele reiterou que a interrupção foi causada por um “problema de resolução de DNS” e prometeu compartilhar um “resumo detalhado pós-evento da AWS”.
analista cálculo O custo total de uma queda de energia pode chegar a bilhões de dólares. Muitos na X comentaram que este evento destaca os perigos de muitas empresas importantes baseadas na Internet dependerem de um único provedor de nuvem.
A senadora Elizabeth Warren (D-Mass.) foi mais longe e mais uma vez pediu a dissolução das principais empresas de tecnologia. “Se uma empresa pode quebrar toda a Internet, ela é muito grande, ponto final. É hora de desmembrar a Big Tech.” twittou.
Atualização 4: Às 12h30 horário do leste dos EUA, havia mais de 9,8 milhões de relatórios do DownDetector em todo o mundo, incluindo mais de 2,7 milhões nos Estados Unidos.
Atualização 3: Até às 10h ET, o DownDetector relatou mais de 8,1 milhões de problemas de conectividade em todo o mundo, incluindo mais de 1,9 milhão nos EUA, mais de 1 milhão no Reino Unido e 418K na França. Quase 2.000 empresas relataram interrupções e 280 estão em andamento.
Atualização 2: Uma versão anterior desta história dizia que os usuários relataram problemas com AT&T, T-Mobile e Verizon. Um porta-voz da T-Mobile disse a Garon que a empresa não sofreu interrupções de rede ou de serviço. “Uma interrupção no serviço de terceiros esta manhã está causando problemas para os clientes ao tentarem usar outros sites ou serviços.” Os usuários acreditaram erroneamente que a culpa era da operadora, mas o serviço que estavam tentando acessar provavelmente estava fora de serviço. AT&T e Verizon ainda não comentaram a interrupção.
Receba as melhores histórias direto na sua caixa de entrada!
Sua dose diária das melhores notícias de tecnologia
Ao clicar em inscrever-se, você confirma que tem 16 anos ou mais e concorda com nossos Termos de Uso e Política de Privacidade.
Obrigado por se inscrever!
Sua assinatura foi confirmada. Observe sua caixa de entrada com atenção!
Atualizar: A Amazon Web Services disse que a interrupção do serviço ocorreu às 6h35, horário do leste dos EUA, devido a um problema no sistema de nomes de domínio (DNS). “A maioria” das operações voltou ao normal, mas a Amazon alertou que “algumas solicitações podem ser limitadas enquanto trabalhamos para uma resolução completa”.
O DownDetector disse ter recebido mais de 6,5 milhões de relatos de problemas de conectividade em todo o mundo, incluindo mais de 1,4 milhão nos EUA e mais de 800.000 no Reino Unido.
“A lição aqui é a resiliência”, diz Luke Kehoe, analista industrial da Ookla. “Muitas organizações ainda centralizam cargas de trabalho críticas em uma única região de nuvem. A distribuição de aplicativos e dados críticos em diversas regiões e zonas de disponibilidade pode reduzir substancialmente o raio de ação de incidentes futuros.”
“À medida que as empresas são incentivadas a confiar mais plenamente nos serviços em nuvem, estes incidentes tornar-se-ão ligeiramente mais frequentes. Mas estes tipos de interrupções, em que os serviços básicos de Internet perturbam grandes serviços online, só acontecem algumas vezes por ano”, disse ele.
História Original:
Você está tendo problemas para acessar seus sites ou aplicativos favoritos? Uma grande interrupção da Internet está a afetar o serviço online mais popular do mundo, limitando milhões de utilizadores em todo o mundo.
Serviços populares como Canva, Coinbase, Disney+, HBO Max, Hulu, Lyft, Reddit, Roku, Signal, Slack, Snapchat, Venmo e outros começaram a relatar problemas em 20 de outubro às 2h ET.
Também está afetando os jogadores da Epic Games Store e da PlayStation Network, que estão enfrentando problemas com títulos como Clash Royale, Dead by Daylight, Fortnite, Roblox e Rocket League.
Esse problema parece ser causado por um problema com Amazon Web Services (AWS). 05h27 horário do leste dos EUA; disse Ele descobriu a “potencial causa raiz” do problema e começou a implementar uma correção. “Estamos vendo sinais significativos de recuperação. A maioria das solicitações agora será bem-sucedida. Continuamos a processar o acúmulo de solicitações em nossa fila”, afirma a Amazon.
Desde então, alguns serviços parecem estar a recuperar com menos problemas relatados. Outros continuaram a cair. Ferramenta de rastreamento de interrupções DownDetector Serviços como Hulu, Roku, HBO Max e Peloton estão enfrentando problemas contínuos.
Muitos dos serviços populares da Amazon também foram afetados pela interrupção: produtos domésticos inteligentes Alexa, Amazon Music, Blink, Prime Video e Ring. As interrupções anteriores relacionadas à AWS resultaram em uma recuperação lenta, mas constante, ao longo de várias horas, portanto, o uso das ferramentas atuais pode exigir paciência.
(Divulgação: Ookla, proprietário do DownDetector, é propriedade da controladora da PCMag, Ziff Davis.)
Introdução aos especialistas

experiência
Sou jornalista há mais de 10 anos, tendo começado a reportar sobre tecnologia em 2013. Ingressarei na Garon em 2025, cobrindo os últimos desenvolvimentos no mundo da tecnologia e escrevendo sobre os dispositivos e serviços que usamos todos os dias. Envie-nos dicas que você acha que seriam do interesse da Garon.
Leia a biografia completa


