2025. október 20. hétfő reggelén az Amazon Web Services (AWS) kulcsfontosságú US-EAST-1 régiójában, amely Észak-Virginia államban, az Egyesült Államok Capitoliumának közelében található, hatalmas felhőszolgáltatási kimaradás történt. Ez a kiesés széles körű zavarokat okozott számos weboldal és platform működésében világszerte.
A leállás érintettjei és hatásai
Az AWS fő e-kereskedelmi platformja mellett több más szolgáltatás is megszakításokat szenvedett el. Ilyenek voltak például az Amazon Ring okos csengői és az Alexa intelligens asszisztens, amelyek egész reggel nem működtek megfelelően. Emellett jelentős fennakadások voltak tapasztalhatók a Meta kommunikációs platformján, a WhatsAppon, az OpenAI által fejlesztett ChatGPT-n, a PayPal Venmo fizetési rendszerén, valamint az Epic Games több webszolgáltatásán is.
Ezen túlmenően több brit kormányzati honlap is elérhetetlenné vált, továbbá számos más, különböző iparágakban működő weboldal és szolgáltatás is érintett volt.
A hiba oka: DNS feloldási problémák az AWS US-EAST-1 régióban
Az AWS által kiadott státuszfrissítések szerint a problémák forrása az Amazon DynamoDB adatbázis alkalmazásprogramozási interfészeinek (API) DNS feloldási hibái voltak ebben a régióban. A DNS (Domain Name System) egy alapvető internetes szolgáltatás, amely lényegében egy automatikus telefonkönyvként működik: webcímeket, például www.wired.com-ot alakít át numerikus IP-címekké, hogy a böngészők helyesen jeleníthessék meg a kívánt tartalmat.
A DNS feloldási problémák akkor lépnek fel, amikor a DNS szerverek nem tudják pontosan összekapcsolni ezeket az adatokat, vagyis rossz IP-címet adnak vissza egy adott domain névhez. Ezt a helyzetet lehet úgy elképzelni, mintha egy telefonkönyv rossz telefonszámot adna meg egy névhez.
„Vizsgálataink alapján a probléma az US-EAST-1 régió DynamoDB API végpontjainak DNS feloldásával kapcsolatos” – közölte az AWS hétfőn.
Később az AWS azt javasolta azoknak a felhasználóknak, akik még mindig problémákat tapasztalnak ezen végpontok elérésével kapcsolatban, hogy próbálják meg kiüríteni (flush) a DNS gyorsítótárukat.
A hiba természetéről és biztonsági vonatkozásairól
Az AWS szóvivője nem adott részletes tájékoztatást arról, hogy pontosan milyen jellegű technikai meghibásodás okozta a DNS problémákat. Fontos megjegyezni, hogy bár a DNS hibák lehetnek rosszindulatú támadások eredményei – például DNS eltérítés (DNS hijacking) –, jelen esetben nincs arra utaló jelzés, hogy az esemény szándékos vagy rosszindulatú tevékenység következménye lett volna.
Davi Ottenheimer, az Inrupt adat-infrastruktúra cég alelnöke és biztonsági műveletek szakértője szerint:
„Amikor a rendszer nem tudta helyesen meghatározni, melyik szerverhez kell csatlakozni, láncreakcióként összeomlottak az internetes szolgáltatások. Ez egy klasszikus rendelkezésre állási probléma, de valójában adatintegritási hibáról van szó.”
A hiba lefolyása és elhárítása
A problémák körülbelül hajnali 3 órakor kezdődtek keleti parti idő szerint (ET). Az AWS már 5:22-kor bevezetett bizonyos kezdeti enyhítő intézkedéseket, amelyek lassan hatni kezdtek. Végül 6:35-re sikerült teljes mértékben orvosolniuk az alapvető technikai hibát.
Azonban az Amazon hangsúlyozta, hogy egyes szolgáltatások még mindig feldolgozás alatt álló munkamenetekkel rendelkeznek, így ezek teljes helyreállítása további időt vehet igénybe.
A központi felhőszolgáltatások előnyei és kockázatai
Az AWS nem először szenved el hasonló nagyszabású kimaradást; például 2023-ban is történt egy jelentős incidens. A Microsoft Azure és a Google Cloud mellett az AWS domináns szereplője a globális felhőpiacnak.
Ezeknek a központi felhőszolgáltatóknak a használata sok szempontból javította a kiberbiztonságot és az internetes stabilitást világszerte. Egységes szabványokat és legjobb gyakorlatokat biztosítanak ügyfeleik számára, amelyek révén könnyebben fenntartható egy alapvető biztonsági szint.
Ugyanakkor ez az egységesítés komoly hátrányokkal is jár: ezek a platformok egyetlen hibaponttá válhatnak sok kritikus szolgáltatás számára. Ha ilyen központi rendszer meghibásodik, akkor annak hatása széles körben érezhető lesz.
„A hibák egyre inkább adatintegritási problémákra vezethetők vissza” – mondja Ottenheimer. – „Sérült adatok, sikertelen érvényesítés vagy jelen esetben hibás névfeloldás mérgezte meg minden további függőséget. Amíg nem értjük meg jobban és nem védjük meg az integritást, addig kizárólag az üzemidőre koncentrálni illúzió.”
Összegzés
A hétfői AWS leállás rávilágított arra, hogy még a legnagyobb és legfejlettebb felhőszolgáltatók rendszerei sem mentesek a kritikus hibáktól. A DNS feloldási problémák miatt számos népszerű online szolgáltatás vált elérhetetlenné vagy működött akadozva világszerte.
Ez az esemény ismételten hangsúlyozza annak fontosságát, hogy ne csak az üzemidőt tartsuk szem előtt, hanem kiemelt figyelmet fordítsunk az adat integritására és megbízhatóságára is. A jövőben várhatóan még nagyobb hangsúlyt kap majd ezen rendszerek robosztusságának fejlesztése annak érdekében, hogy hasonló incidensek ritkábban forduljanak elő.
Forrás: https://www.wired.com/story/what-that-huge-aws-outage-reveals-about-the-internet/