Amikor hétfő reggel az Egyesült Államok keleti partján az emberek felébredtek, az Amazon Web Services (AWS) észak-virginiai munkatársai már valószínűleg teljes erőbedobással dolgoztak egy olyan problémán, amely világszerte számos népszerű alkalmazás és internetes szolgáltatás működését állította le.
Mi történt pontosan az US-East-1 adatközpontban?
Az US-East-1 az AWS legnagyobb és legaktívabb adatközpont-csoportja, amely Észak-Virginia területén található. Ez a központ volt a hibák forrása, amelyek miatt több tucat platform – köztük a ChatGPT, Signal, Coinbase vagy akár a Fortnite – elérhetetlenné váltak. A The Verge és más források szerint a szolgáltatások körülbelül három órán át voltak offline, majd reggel 6:30 körül kezdtek helyreállni, bár az AWS figyelmeztetett arra, hogy késések még előfordulhatnak.
Mi is az az US-East-1 adatközpont?
Minden nap emberek milliárdjai küldenek nagy fájlokat e-mailben, posztolnak közösségi oldalakon, vásárolnak online vagy néznek filmeket streaming szolgáltatásokon keresztül. Ezek az adatok valahol tárolódnak – ezt nevezzük „felhőnek”.
Fontos megérteni, hogy a felhő nem egy távoli hely az égben, hanem fizikai szervereken tárolt adatok összessége. Az adatok nem a személyes eszközünkön vannak, hanem adatközpontokban elhelyezett szervereken. Az US-East-1 pedig az egyik legnagyobb ilyen komplexum a világon.
Az US-East-1 2006-ban épült, és az Amazon Web Services indulásának egyik alapköve. Több adatközpontból álló campus Virginia államban működik, és sok nagy weboldal infrastruktúráját biztosítja megbízhatósága miatt. Azonban az utóbbi években tapasztalt kimaradások rontották hírnevét.
Miért pont Észak-Virginia?
Virginia rendelkezik a világ legnagyobb adatközpont-piacával: több mint 300 ilyen létesítmény működik itt, különösen Loudoun megyében található a híres „Data Center Alley”.
- Kormányzati közelség: A szövetségi kormány közelsége vonzóvá teszi a régiót.
- Adókedvezmények: Az állam jelentős adómentességet biztosít azoknak a beruházásoknak, amelyek legalább 150 millió dollár értékűek és legalább 50 új munkahelyet teremtenek. 2021-ben ezt módosították: bizonyos területeken már 10 új munkahely és 70 millió dolláros beruházás is elegendő.
- Gyors fejlődés: Ezek a kedvezmények lehetővé tették az US-East-1 és más adatközpontok gyors növekedését a régióban.
Miért okozott globális problémát egy helyi hiba?
Bár ma már világszerte számos AWS adatközpont működik, sok technológiai cég erősen támaszkodik az US-East-1 régióra annak népszerűsége és széleskörű szolgáltatásai miatt. Amikor egy új ügyfél csatlakozik az AWS-hez, gyakran alapértelmezettként erre a régióra irányítják adataik feldolgozását.
Nagy ügyfelek között vannak légitársaságok, híroldalak, online kereskedelmi platformok, streaming szolgáltatók és szinte minden internetes szegmens képviselői.
Ezen túlmenően az US-East-1 globális infrastruktúrát is működtet olyan kulcsfontosságú internetes szolgáltatásokhoz, mint például:
- Route 53 Public DNS: Az internetes címek IP-címekké alakításának alapvető rendszere.
- Amazon CloudFront: Egyik fő tartalomszolgáltató hálózat (CDN), amely gyorsítja a weboldalak betöltését világszerte.
Még ha egy adott szolgáltatás nem is használja közvetlenül az US-East-1-et, akkor is előfordulhat, hogy valamilyen láncszemként kapcsolódik hozzá. Ezért egyetlen zavar is széles körű hatást válthat ki.
Mely szolgáltatások érintettek a kimaradás során?
A következő lista nem teljes körű, de ezek voltak a legismertebb érintett platformok:
- Amazon és leányvállalatai
- AT&T
- Canva
- Coinbase
- Delta Airlines
- Disney+
- Flickr
- Fortnite
- Hulu
- McDonald’s
- Perplexity
- Playstation
- Roblox
- Roku
- Signal
- Snapchat
- United Airlines
- Venmo
- YouTube
Milyen okot jelölt meg az AWS?
A vállalat egy „alapvető DNS-problémára” hivatkozott. Az Amazon DynamoDB-ben fellépő zavar megszakította azon szerverekhez vezető kapcsolatokat, amelyek biztosítják az internetkapcsolatot. Egyszerűbben fogalmazva: a rendszer, amely általában lefordítja a domain neveket IP-címekké (amelyeket a számítógépek értelmezni tudnak), átmenetileg nem működött megfelelően.
Kiemelendő, hogy ez az incidens nem tűnik kibertámadás eredményének. Az AWS azt javasolja azoknak, akik még mindig tapasztalnak késéseket vagy problémákat, hogy ürítsék ki DNS gyorsítótárukat (DNS cache).
Milyen gyakoriak ezek a kimaradások? Várható-e hasonló esemény a jövőben?
Ilyen adatközpont-kimaradások viszonylag gyakoriak lehetnek – különösen egy ekkora méretű infrastruktúránál, mint amilyen az US-East-1. Korábbi jelentős esetek között szerepel:
- 2017: Egy nagyobb kimaradás szinte egész internetet érintett.
- 2021: Az eddigi legnagyobb AWS-kimaradás történt ebben az évben.
- 2023: Több szolgáltatás esett ki egy újabb hiba miatt.
A probléma nem kizárólagosan csak az AWS-re jellemző; minden adatfeldolgozó rendszer ki van téve áramkimaradásoknak, kibertámadásoknak vagy belső hibáknak. A vállalatok ezért gyakran beruháznak redundáns rendszerekbe vagy több régióban hosztolják adataikat ugyanazon szolgáltatónál – azonban ez jelentős költségekkel jár.
Következtetés: Mi várható a jövőben?
A modern internet működésének alapját képezik ezek az óriási adatközpontok. Ahogy nő az igény például mesterséges intelligencia fejlesztésekhez szükséges számítási kapacitásra, úgy várhatóan egyre több ilyen incidens fog előfordulni. Bár igyekeznek minimalizálni ezeket a kieséseket, teljes mentesítésük szinte lehetetlen.
Egyetlen adatközpont hibája is képes globális hullámokat vetni – ezért fontos megérteni ezek működését és hatásait mindennapi digitális életünkre.
Forrás: https://technical.ly/entrepreneurship/aws-us-east-1-outage-explainer/