Dr. Saqib Kakvi, a londoni Royal Holloway Egyetem Információbiztonsági Tanszékének szakértője részletesen elemezte a 2024. június 10-én történt Microsoft Azure szolgáltatáskimaradást, amely jelentős hasonlóságot mutat a múlt heti Amazon Web Services (AWS) DNS-problémájával.
A kiesés részletei és az első jelzések
Körülbelül 16:00 UTC-kor a Microsoft Azure jelentette, hogy DNS-problémák léptek fel, amelyek több szolgáltatás teljesítményének romlását okozták. A vállalat közleménye szerint az ügyfelek nehézségekbe ütközhetnek az Azure portálok elérésében.
Egy további figyelmeztetés érkezett 17:10 UTC-kor, amelyben arra kérték a felhasználókat, hogy ne használják közvetlenül az Azure Front Door webes portált, hanem inkább alacsonyabb szintű eszközöket, például PowerShellt vagy parancssori interfészeket (CLI). Ez a tanács megerősíti, hogy a probléma gyökere a DNS-ben keresendő, amely alapvető szerepet játszik abban, hogy a weboldalak és webszolgáltatások elérhetővé váljanak.
A DNS és BGP protokollok szerepe a kiesésben
Dr. Kakvi rámutatott, hogy ez az incidens nagyon hasonlít az előző heti AWS kieséshez, amely szintén DNS-hibából eredt. Mivel mindkét esetben nagy volumenű szolgáltatásokról van szó, felmerülhet a BGP (Border Gateway Protocol) érintettsége is. A BGP egy olyan hálózati protokoll, amely együttműködik a DNS-sel annak érdekében, hogy a webszolgáltatások felfedezése és elérése zökkenőmentes legyen.
A Microsoft 17:17 UTC-kor kiadott frissítése szerint egy „véletlen konfigurációs változtatás” vezetett a problémához. Ez alátámasztja azt a feltételezést, hogy BGP-konfigurációs hiba állhat a háttérben, hiszen korábban is előfordult már, hogy ilyen jellegű hibák hasonló hatásokat váltottak ki.
A felhőszolgáltatók triopol helyzete és annak kockázatai
Jelenleg az Amazon (AWS), Microsoft (Azure) és Google uralja a globális felhőszolgáltatások piacát – ezt nevezhetjük hatékony triopolnak. Ez azt jelenti, hogy még egy részleges infrastruktúra-kiesés is képes megbénítani több száz vagy akár több ezer alkalmazást és rendszert világszerte.
A webtartalmak hosztolásának költségei miatt gazdasági erők vezetik az erőforrások koncentrálódását néhány nagyon nagy szolgáltatóhoz. Bár ez költséghatékonyságot eredményez, valójában azt jelenti, hogy „minden tojásunkat három kosárba tesszük” – ami növeli az egész internetes ökoszisztéma sebezhetőségét egy-egy ilyen incidens során.
Összegzés és tanulságok
- A legutóbbi Microsoft Azure kiesés fő oka egy DNS-probléma volt, amelyet vélhetően egy véletlen BGP-konfigurációs hiba idézett elő.
- Ez az eset jelentős párhuzamot mutat az előző heti AWS DNS-kieséssel, ami rávilágít arra, milyen kritikus szerepet játszanak ezek a protokollok a felhőalapú szolgáltatások működésében.
- A piacot uraló három nagy szolgáltató triopol helyzete miatt egy-egy ilyen incidens széles körű hatással lehet számos vállalkozásra és felhasználóra világszerte.
- A jövőben fontos lehet alternatív megoldások keresése és a szolgáltatói függőség csökkentése annak érdekében, hogy minimalizáljuk az ilyen jellegű kockázatokat.
Az informatikai infrastruktúrák megbízhatósága kulcsfontosságú tényezővé vált napjaink digitális világában. Az ilyen incidensek rámutatnak arra, hogy bár technológiailag fejlettek vagyunk, még mindig vannak sebezhető pontok, amelyekre oda kell figyelni mind fejlesztőknek, mind üzleti döntéshozóknak.
Forrás: https://www.mirror.co.uk/news/world-news/amazon-internet-down-live-aws-36153657