Az Amazon Web Services (AWS), a felhőinfrastruktúra piac vezető szereplője, jelentős leállást jelentett hétfőn, amely számos ismert weboldal működését érintette. A kiesés reggel kezdődött, és bár sok oldal néhány órán belül újra elérhetővé vált, a Downdetector adatai szerint délelőtt 12 óra körül ismét megnövekedett a felhasználói bejelentések száma az AWS, az Amazon és az Alexa szolgáltatásokkal kapcsolatban.
A leállás részletei és az AWS reakciója
Az AWS legfrissebb frissítése 18:53-kor (ET) arról számolt be, hogy „minden AWS szolgáltatás visszatért a normál működéshez” röviddel 18 óra után. Azonban néhány szolgáltatás még mindig feldolgozás alatt álló üzenetekkel rendelkezik, amelyek várhatóan a következő órákban kerülnek feldolgozásra.
„Részletes esemény utáni összefoglalót fogunk megosztani” – ígérte a cég a közleményben.
A kiesés okai és hatása
A leállás hétfőn délelőtt továbbra is fennállt, amikor az AWS „megnövekedett hibaarányokat” észlelt az EC2 szolgáltatás új példányainak indításakor. Az EC2 az egyik legnépszerűbb AWS szolgáltatás, amely virtuális szerverkapacitást biztosít.
Az AWS ekkor azt írta: „Mindent megteszünk annak érdekében, hogy a szolgáltatást a lehető leggyorsabban helyreállítsuk.”
Körülbelül 13:30-kor (ET) az AWS jelezte, hogy egyes régiókban már „korai jelei” mutatkoznak az EC2 helyreállásának, és javításokat alkalmaznak a fennmaradó területeken. Ezzel párhuzamosan várhatóan csökkennek majd az indítási hibák és hálózati kapcsolódási problémák.
Érintett szolgáltatások és vállalatok
Az Amazon megerősítette, hogy a kiesés érintette az Amazon.com weboldalt, néhány leányvállalatát, valamint az AWS ügyfélszolgálati műveleteit is.
A kiesést először hajnalban, 3:11-kor (ET) jelentették az AWS fő US-East-1 régiójában, amely Észak-Virginia területén található. Az AWS állapotoldalán közzétett értesítés szerint DNS problémák léptek fel a DynamoDB adatbázis-szolgáltatásnál – ez egy kulcsfontosságú adatbázis-szolgáltatás, amely számos más AWS alkalmazás alapját képezi.
A DNS (Domain Name System) felelős azért, hogy a weboldalak neveit IP-címekké alakítsa át, így a böngészők és egyéb alkalmazások betölthetik azokat.
Az AWS válaszlépései
5:01-kor (ET) kiadott frissítésében az AWS „üzemeltetési problémát” jelzett több szolgáltatásnál, és közölte, hogy „több párhuzamos úton dolgoznak a helyreállítás felgyorsításán”. Több mint 70 saját szolgáltatásuk érintett volt.
6:35-kor (ET) azt közölték, hogy a DNS probléma „teljes mértékben enyhült”, és az AWS szolgáltatások működése „normális”.
A piacvezető szereplő és a kiesés globális hatása
Az AWS piacvezetőként mintegy egyharmados részesedéssel bír a felhőinfrastruktúra technológia piacán, megelőzve a Microsoftot és a Google-t – derül ki a Synergy Research Group adataiból. Milliók vállalatok és szervezetek támaszkodnak az AWS-re szerverek és tárolási megoldások terén.
Legnagyobb érintett cégek és szolgáltatások
- Disney+
- Lyft
- McDonald’s alkalmazás
- The New York Times
- Ring ajtócsengők
- Robinhood
- Snapchat
- United Airlines
- T-Mobile
- Venmo
- Brit kormányzati oldalak (Gov.uk és HM Revenue and Customs)
- Lloyds Banking Group
- Amazon belső rendszerei (raktárak, szállítási alkalmazások)
- Seller Central (Amazon harmadik fél eladói platformja)
- Canvas oktatási platform
- Roblox és Fortnite játékok
- Coinbase kriptotőzsde
- Canva grafikai eszköz
- Perplexity generatív mesterséges intelligencia keresőeszköz
Kormányzati reakciók és ügyfélkommunikációk
A brit kormány szóvivője elmondta: „Tudomásunk van egy incidensről, amely érinti az Amazon Web Services-t és több online szolgáltatást, amelyek infrastruktúrájukra támaszkodnak. Kapcsolatban vagyunk a céggel, akik azon dolgoznak, hogy minél gyorsabban helyreállítsák a szolgáltatásokat.”
A Lloyds Banking Group megerősítette, hogy néhány szolgáltatásuk érintett volt, és kérte ügyfeleit türelmükért. Később jelezték, hogy fokozatosan visszaállnak a rendszerek.
Belső Amazon rendszerek kiesései
A Redditen megjelent beszámolók szerint az Amazon raktári dolgozói és szállítói is tapasztalták belső rendszereik leállását. Egyes munkavállalókat arra utasítottak, hogy munkaidejük alatt várakozzanak pihenőhelyeken vagy rakodási területeken. Az Anytime Pay alkalmazás sem volt elérhető – ez az app lehetőséget ad arra, hogy a dolgozók előre hozzáférjenek fizetésük egy részéhez.
Egyéb érintett platformok és szolgáltatások
- A Reddit szóvivője közölte: „Folyamatosan dolgozunk azon, hogy visszaállítsuk Reddit teljes kapacitását.”
- Egyes United Airlines és Delta Air Lines ügyfelek nem tudtak online foglalásaikhoz hozzáférni vagy becsekkolni.
- A T-Mobile ügyfélszolgálata jelezte: bár ügyfeleik más oldalak használata során tapasztaltak problémákat az AWS zavar miatt, náluk nem volt hálózati vagy szolgáltatási kimaradás.
- A Canvas oktatási platform is jelentős fennakadásokról számolt be.
- Különböző felhasználók beszámoltak felhőalapú játékok – például Roblox és Fortnite – működési zavarairól.
- A Coinbase kriptotőzsde sok felhasználó számára elérhetetlenné vált.
- A Canva grafikai eszköz jelentős hibaarány-növekedést tapasztalt alapvető funkcióiban.
- A Perplexity mesterséges intelligencia keresőeszköz fejlesztője megerősítette az AWS okozta problémát.
Központi szoftverek sebezhetősége – tanulságok a leállásból
A közelmúltban nem ez volt az első alkalom, hogy jelentős technikai probléma globális hatással járt. 2024 júliusában például egy hibás szoftverfrissítés miatt több Microsoft Windows rendszer összeomlott világszerte – ez milliós károkat okozott és több ezer járatot töröltek. Kórházakat és bankokat is érintett ez az incidens.
Az AWS korábban is tapasztalt hasonló leállásokat: 2023-ban több órás kiesés volt számos weboldalon; 2021-ben pedig egy súlyosabb incidens világszerte érintette weboldalakat és szolgáltatásokat – beleértve Amazon saját szállítási műveleteit is.
A versenyhelyzet a nagy felhőszolgáltatók között
Amazon, Microsoft és Google régóta versengenek vállalati ügyfelekért. A Microsoft termelékenységi szoftvercsomagjának nemrégiben történt kiesése után a Google igyekezett kihasználni ezt az alkalmat saját eszközeinek népszerűsítésére és üzletmenet-folytonossági tervének bemutatására.
„Csak azért mert a Microsoft 365 leáll – ami kérdéses mikor és mennyi ideig tart –, nem kell visszatérni papírhoz-ceruzához.” – Google blogbejegyzésből idézet.
A Google júniusi hosszabb idejű leállása szintén több nagy szolgáltató működését zavarta meg (például OpenAI-t vagy Shopify-t), amit hibás frissítések okoztak.
Kibertámadás kizárva – technikai hiba okozta a problémát?
Bár kezdetben sokan aggódtak kibertámadás miatt, szakértők szerint inkább technikai hiba állhatott a háttérben. Rob Jardin, a NymVPN kiberbiztonsági cég digitális vezetője szerint valószínűleg egy fő adatközpont meghibásodása okozta a problémát.
„Ilyen esetek akkor fordulnak elő, amikor túlterhelődnek rendszerek vagy egy kulcshálózati elem meghibásodik. Mivel rengeteg weboldal és alkalmazás támaszkodik az AWS-re, az ilyen zavar gyorsan terjed” – magyarázta Jardin.
Szakértők véleménye – mi történt pontosan?
Mik Chapple informatikai professzor (Notre Dame Egyetem) szerint bár sok fogyasztó nem ismeri közvetlenül a DynamoDB-t, ez valójában „az internet modern adatnyilvántartóinak egyike”. Korai jelentések alapján nem maga az adatbázis sérült meg; inkább azokkal a rekordokkal volt gond, amelyek más rendszereket irányítanak arra vonatkozóan, hol találják meg adataikat.
„Ez az eset emlékeztet arra, mennyire függünk néhány nagy felhőszolgáltatótól: Amazontól, Microsofttól és Google-től. Amikor egyikük ‘tüsszent’, az egész internet megfázik.”
Forrásmegjelölés