Az AWS US-EAST-1 régió leállása: Több mint 108 szolgáltatás érintett és tanulságok a felhőszolgáltatások megbízhatóságáról

okt 21, 2025 | Tech

2024. október 20-án reggel az Amazon Web Services (AWS) US-EAST-1 régiójában súlyos incidens történt, amely több mint 108 AWS szolgáltatást bénított meg, és ezrek ügyfeleinek rendszereit érintette világszerte. Az eset rávilágított a felhőalapú infrastruktúrák komplexitására és a redundancia fontosságára.

Az incidens háttere és az érintett szolgáltatások

A The Stack információi szerint az esemény után még mindig több mint 78 AWS szolgáltatás működése volt korlátozott vagy degradált állapotban. Az Amazon kezdetben a DynamoDB API végpontjának DNS-felbontási problémáit jelölte meg az esemény kiváltó okaként az US-EAST-1 régióban.

Később az AWS pontosította, hogy az incidens forrása az EC2 belső hálózatán belül található egy alrendszer volt, amely a hálózati terheléselosztók egészségi állapotának monitorozásáért felelős. Ez a belső rendszer hibája vezetett a láncreakcióhoz, amely végül számos más szolgáltatás működését is befolyásolta.

Korábbi hasonló esetek – tanulságok 2021-ből

A mostani incidens emlékeztet a 2021. december 7-i hasonlóan kiterjedt US-EAST-1 leállásra, amikor az AWS szintén hálózati eszközök meghibásodását jelölte meg elsődleges okként. Akkor az automatizált kapacitásbővítési folyamat egy váratlan viselkedést váltott ki, amely túlterhelte a belső hálózati eszközöket.

Az AWS utólagos elemzése szerint a belső hálózatban kialakult torlódás miatt a monitoring, belső DNS és EC2 vezérlési sík egyes részei is érintettek voltak, ami láncreakcióként további problémákat okozott.

A DNS-felbontási problémák és azok hatása az AWS szolgáltatásokra

Az esemény során a DNS-felbontási hibák miatt először a DynamoDB regionális végpontjai nem voltak elérhetők, ami közvetlenül befolyásolta az EC2 példányok indítását is, mivel ezek függnek a DynamoDB-től bizonyos működési folyamatokban.

Ezt követően a Network Load Balancer egészségügyi ellenőrzései is károsodtak, ami további hálózati kapcsolódási problémákhoz vezetett olyan kulcsfontosságú szolgáltatásoknál, mint például a Lambda, DynamoDB és CloudWatch.

A helyreállítás folyamata és jelenlegi állapot

Az AWS közleménye szerint október 20-án 12:26-kor azonosították az esemény kiváltó okát, majd folyamatosan dolgoztak a problémák megoldásán. Délután 15:01-re minden AWS szolgáltatás visszatért normál működéséhez.

Néhány szolgáltatás – például az AWS Config, Redshift és Connect – még üzenetfeldolgozási késedelemmel küzdött, amelyeket néhány órán belül pótolni fognak. Az Amazon ígéretet tett egy részletes utólagos jelentés közzétételére is.

A támogatási rendszer fejlesztése és annak kihívásai

A 2021-es nagy leállást követően az AWS vállalta egy új támogatási rendszer kiépítését, amely több régióban is aktívan futna párhuzamosan. Ennek részeként 2022 augusztusában bevezettek egy új támogatói konzolt, amely magas rendelkezésre állást és régiók közötti redundanciát biztosít.

Ennek ellenére az idei incidens során több ügyfél panaszkodott arra, hogy a támogatás nem volt megfelelően elérhető vagy hatékony – különösen az amerikai keleti parton kívüli időzónákban.

A felhőszolgáltatások megbízhatósága: valóság vagy mítosz?

Ismael Wrixen, a ThriveCart vezérigazgatója szerint ez az eset nem csupán egy „keleti parti AWS probléma”, hanem emlékeztető arra, hogy a száz százalékos rendelkezésre állás minden szolgáltató számára csak illúzió.

„Az internet megosztott infrastruktúrán fut. A valódi történet nem csak arról szól, hogy az AWS kritikus hibát szenvedett el, hanem arról is, hogy hány vállalkozás fedezte fel: platformpartnereiknek nincs megfelelő terve ilyen helyzetekre – különösen azon kívül, amikor az Egyesült Államokban nappal van.” – írta e-mailben Wrixen.

Ez komoly figyelmeztetés arra nézve, hogy mennyire fontos a multi-regionális redundancia alkalmazása kritikus üzleti rendszerek esetén.

Kitekintés: mi várható az utólagos elemzésben?

A The Stack szerkesztősége mindig nagy érdeklődéssel várja a nagy hyperscaler incidensek utólagos elemzését (post-mortem). Ezekből tanulhatunk arról, hogyan kezelik a legnagyobb felhőszolgáltatók a váratlan helyzeteket:

  • Google Cloud Párizsban: tűzeset és árvíz okozta zavarok;
  • Microsoft Azure: titkosítási kulcs infrastruktúra problémái;
  • AWS korábbi incidensek: adatközpont hűtési problémák;
  • HPE esetek: kritikus adatok törlése frissítés miatt.

Mindezek fényében izgatottan várjuk az AWS legfrissebb részletes jelentését arról, hogy pontosan mi történt október 20-án reggel az US-EAST-1 régióban.

Összegzés

Az AWS US-EAST-1 régiójában történt incidens ismételten rámutatott arra, hogy még a legnagyobb felhőszolgáltatók infrastruktúrája sem mentes a hibáktól. A komplex rendszerekben egyetlen komponens meghibásodása láncreakciót indíthat el, amely széles körű szolgáltatáskimaradást eredményezhet.

A vállalatoknak ezért érdemes komolyan venniük a multi-regionális redundancia kialakítását és felkészülniük arra is, hogy partnerük sem garantálhatja soha teljes körűen a megszakítás nélküli működést. A jövőben pedig fontos lesz figyelemmel kísérni az AWS által közzétett részletes utólagos elemzést is.

Forrás: https://www.thestack.technology/aws-outage-cause-network/

Hurricane Melissa: AI által generált videók terjednek a TikTokon

Hurricane Melissa közeledtével Jamaika felé egyre több drámai, mesterséges intelligencia (AI) által készített videó jelenik meg az interneten, különösen a TikTok platformján. Ezek a tartalmak milliós nézettséget érnek el, ám sok esetben megtévesztőek vagy teljesen...

Sir Anthony Hopkins őszintén a házasságáról és családi életéről

Sir Anthony Hopkins, a világhírű walesi színész, aki olyan ikonikus filmekben játszott, mint a <em"a bárányok="" em="" hallgatnak", Nixon, A két pápa vagy Az apa, most személyes életének mélyebb titkait tárja fel új önéletrajzában, We...

Hurricane Melissa: AI által generált videók terjednek a TikTokon

Hurricane Melissa közeledtével Jamaika felé egyre több drámai, mesterséges intelligencia (AI) által készített videó jelenik meg az interneten, különösen a TikTok platformján. Ezek a tartalmak milliós nézettséget érnek el, ám sok esetben megtévesztőek vagy teljesen...

Gen Z munkaerőpiaci kihívásai: a verseny és az AI hatása a pályakezdők helyzetére

A Z generációt gyakran kritizálják lustaságért és ambícióhiányért, mintha nem érdekelné őket a karrierépítés vagy a vállalati ranglétrán való előrelépés. Azonban a valóság ezzel szemben áll: a Gen Z tagjai ugyanolyan eltökéltek, mint az előző generációk, például a...

Flavonolok és a szív- és érrendszeri egészség: Új kutatási eredmények a Birmingham Egyetemről

A flavonolok olyan polifenolos vegyületek, amelyek természetes módon megtalálhatók bizonyos gyümölcsökben, teában, diófélékben és kakaóbabban. Ezek az anyagok egyre nagyobb figyelmet kapnak az egészségügyi kutatásokban, különösen a szív- és érrendszeri betegségek...

AI és a Dunning-Kruger effektus fordítottja: Miért becsüljük túl képességeinket ChatGPT használatakor?

Az AI túlbecslés jelensége – egy friss kutatás szerint, amikor mesterséges intelligencia eszközökkel, például a ChatGPT-vel dolgozunk, mindenki hajlamos túlbecsülni saját teljesítményét, függetlenül attól, mennyire jártas az adott technológiában. Ez a felismerés...

Eli Lilly és Nvidia szuperkomputere forradalmasítja a gyógyszerfejlesztést mesterséges intelligenciával

Az Eli Lilly és az Nvidia partnerségében létrejövő szuperkomputer és mesterséges intelligencia (AI) gyár új korszakot nyithat a gyógyszeriparban. A két vállalat kedden jelentette be, hogy közösen építik meg az iparág „legnagyobb teljesítményű” szuperszámítógépét,...

Microsoft és Satya Nadella jövőképe a játékpiacon: Xbox, Windows és a rövid videók versenye

Satya Nadella, a Microsoft vezérigazgatója nemrégiben megerősítette az Xbox vezetőségének álláspontját, miszerint a vállalat nem más játékkonzolokat vagy platformokat tekint elsődleges versenytársának, hanem a rövid formátumú videókat, mint például a TikTokot. Ez az...

A Tejútrendszer legnagyobb alacsony frekvenciás rádióképe – új távlatok a csillagászatban

Az International Centre of Radio Astronomy Research (ICRAR) csillagászai elkészítették a valaha készült legnagyobb alacsony frekvenciás rádiószínes képet a Tejútrendszerről. Ez a lenyűgöző új kép a déli félteke nézőpontjából mutatja be galaxisunkat, feltárva azt a...

Az érzelmi intelligencia szerepe a diákok együttműködésében és problémamegoldásában

Az érzelmi intelligencia egyre inkább előtérbe kerül az oktatásban, különösen akkor, amikor diákoknak csoportosan kell dolgozniuk komplex problémák megoldásán. Egy friss kutatás kimutatta, hogy a diákcsapatok kollektív érzelmi intelligenciája jelentős előrejelzője...

Amazon 14 000 fős leépítése: az AI és a gyors változások hatása a vállalatra

Az Amazon bejelentette, hogy mintegy 14 000 alkalmazottjától válik meg vállalati szinten. Ez a lépés egy korábbi Reuters-jelentést követ, amely szerint akár 30 000 munkavállaló is elveszítheti állását. Az Amazon az Engadgetnek megerősítette, hogy a 14 000 pozíciót ma...