Amazon Web Services (AWS) meddelar att den incident som orsakade omfattande driftstörningar under morgonen är ”fullt åtgärdad”. Effekterna märktes i sociala appar, spel, streaming och finans – däribland Snapchat, Fortnite, Disney+, Coinbase samt brittiska bankkoncerner som Lloyds och Halifax. Återhämtningen pågår fortfarande för en del användare när köade processer arbetas igenom.
Läget i korthet
-
Status: AWS uppger att ett underliggande DNS/DynamoDB-relaterat fel i regionen US-EAST-1 har åtgärdats. De flesta tjänster svarar normalt, men tillfällig strypning (throttling) och fördröjningar kan kvarstå tills eftersläpningar är borta.
-
Drabbade ekosystem: Sociala appar (bl.a. Snapchat), spel (Fortnite, Roblox, PlayStation Network), produktivitetsverktyg (Canva, Slack), streaming (Disney+, Hulu, Prime Video) och banktjänster i Storbritannien med rapporterade inloggningsstörningar och enstaka nekade kortköp.
-
Krypto/AI: Coinbase och AI-bolaget Perplexity kopplade sina störningar direkt till AWS-felet.
Tidslinje (svensk tid)
-
Tidigt i morse: Kraftigt förhöjda felgrader och latens i US-EAST-1. Flera tjänster får inloggningsfel och timeout.
-
Förmiddag: AWS rapporterar tidiga tecken på återhämtning efter initiala åtgärder. Rekommendation att återförsöka misslyckade anrop.
-
Mitt på dagen: AWS säger att problemet är ”fullt åtgärdat” men varnar för svansfel när backloggar (t.ex. i CloudTrail och Lambda) behandlas.
Varför slog det så brett?
AWS är en av de största globala molnplattformarna. Många konsument- och företagslösningar bygger på samma grundkomponenter (databaser, köer, lagring, identitet). När en central region drabbas kan beroenden i flera lager påverkas samtidigt – från appinloggning och betalning till spelmatchning och videostreaming.
Effekten för användare
Upplevelsen varierade kraftigt: vissa kunde använda tjänster som vanligt, andra möttes av felmeddelanden eller nekade inloggningar/kortköp. I takt med att åtgärder rullades ut började anrop lyckas efter återförsök, och för många hjälpte omstart av app eller rensad cache.
Vad händer tekniskt efter en sådan incident?
-
Köer töms: Händelser och loggar som köats upp bearbetas successivt, vilket kan ge fördröjda leveranser och tillfälliga toppar i latens.
-
Throttling i övergången: En liten andel anrop kan fortsatt timea ut eller strypas tills belastningen stabiliseras.
-
Klientbeteende avgör: System med exponentiell backoff, idempotenta återförsök och tidsgränser per delsteg återhämtar sig snabbare.
Lärdomar som brukar dras i efteranalysen
-
Riskspärrar: Dela upp kritiska arbetsflöden så att ett fel i en region inte stoppar hela tjänsten (”blast radius”).
-
Degraderat läge: Säkerställ att inloggning, betalning, orderflöden och kvittenser fungerar i enklare läge vid delstörningar.
-
Multiregional design: Aktiv-aktiv mellan regioner, testad failover och oberoende DNS-vägar.
-
Robust klientlogik: Återförsök med backoff, cachestrategier och tydliga felmeddelanden till användare.
Utsikter under dagen
AWS räknar med normal drift i takt med att eftersläpande jobb slutförs. Enstaka användare kan märka tillfälliga fel och extra latens tills köerna är borta och klienter uppdaterat cache/inloggningssessioner. För drift- och utvecklingsteam följer sedvanlig post-mortem och eventuella förändringar i arkitektur och processer för att minska påverkan vid framtida regionala störningar.



