Neler yeni

KFN Microsoft Azure Çöküşü: Milyonlarca Siteye Erişim Kesildi

📢 KralForum’a Hoş Geldiniz!

Sadece üyelere özel içeriklere erişmek ve topluluğumuzun bir parçası olmak için şimdi ücretsiz üye ol. 👉 Hemen aramıza katıl, sohbetlere dahil ol ve ayrıcalıkları keşfet!

KFN Haberleri: Microsoft Azure Çöktü! Küresel BGP ve DNS Arızası Milyonlarca Siteyi ve Servisi Erişilmez Hale Getirdi!​

Teknoloji dünyası son on yılın en büyük altyapı krizlerinden biriyle sarsıldı. Microsoft'un küresel bulut omurgası olan Azure, bugün TSİ 16:45 sularında başlayan ve saatler süren devasa bir kesinti yaşadı. Kök nedenin, küresel internet yönlendirme protokolü BGP'deki (Border Gateway Protocol) hatalı bir yapılandırmadan kaynaklanan bir "route leak" (rota sızıntısı) ve bunu takip eden zincirleme DNS (Domain Name System) çöküşü olduğu bildirildi. Bu çöküş, sadece Microsoft'un kendi hizmetleri olan Teams, Office 365 ve Xbox Live'ı değil, aynı zamanda altyapısını Azure üzerinde barındıran milyonlarca web sitesini, bankacılık uygulamasını ve kritik kurumsal hizmeti de saatlerce çevrimdışı bıraktı. Milyarlarca dolarlık ekonomik etkiye yol açan bu olay, "tüm yumurtaları tek sepete koyma" riskini bir kez daha acı bir şekilde gündeme getirdi.

Microsoft-Azure.png

1. Krizin Boyutu: Sadece Teams Değil, İnternetin Bir Parçası Koptu​

Kesintinin ilk sinyalleri, dünya genelindeki kurumsal kullanıcıların Microsoft Teams toplantılarına katılamaması ve Outlook e-postalarının senkronize olmamasıyla geldi. Ancak sorunun boyutu, dakikalar içinde anlaşıldı. Bu, basit bir hizmet kesintisi değil, Azure'un temel ağ altyapısını hedef alan bir çöküştü.

Downdetector ve NetBlocks gibi küresel internet izleme servisleri, Kuzey Amerika, Avrupa ve Asya'daki ana Azure veri merkezlerine (region) yönelik erişim hatalarında yüzde 10.000'i aşan artışlar raporladı.

Etkilenen hizmetlerin listesi, modern dünyanın dijital bağımlılığının bir özeti gibiydi:

  • Kurumsal Hizmetler: Microsoft 365 (Word, Excel, PowerPoint Online), Dynamics 365, SharePoint ve Azure DevOps (CI/CD pipeline'ları durdu, yazılım geliştirme süreçleri kilitlendi).
  • Son Kullanıcı Hizmetleri: Xbox Live (oyuncular oturum açamadı), Microsoft Store ve Skype.
  • Üçüncü Parti Şirketler: Altyapısını Azure'da barındıran binlerce e-ticaret sitesi, havayolu rezervasyon sistemleri, online bankacılık platformları ve sağlık hizmetleri veritabanları tamamen erişilemez hale geldi.
Milyonlarca işletme, kelimenin tam anlamıyla "fişinin çekildiğini" hissetti. Bu durum, Azure'un artık sadece bir "hizmet sağlayıcı" değil, küresel ekonominin kritik bir altyapı bileşeni olduğunu kanıtladı.

2. Kök Neden Analizi: BGP Sızıntısı ve Zincirleme DNS Felaketi​

Microsoft'un Azure Durum (Status) sayfasında yer alan ilk "Sorunu araştırıyoruz" açıklamasının ardından, ağ mühendisleri sorunun kaynağını belirledi: Felaket, iki aşamalı bir ağ hatasıydı.

Aşama 1: BGP Rota Sızıntısı (Route Leak)BGP, internetin "GPS"i veya "adres defteri" olarak düşünülebilir. Hangi veri paketinin hangi yoldan gideceğini belirleyen protokoldür. Güvenilir kaynaklara göre, Azure'un (veya işbirliği yaptığı büyük bir Tier-1 internet sağlayıcısının) yaptığı hatalı bir BGP yapılandırması, Azure'a ait IP adresi bloklarının internetin geri kalanına yanlış bir yoldan "ilan edilmesine" (advertisement) neden oldu.

Bu "sızıntı", küresel internet trafiğinin Azure sunucularına ulaşmaya çalışırken bir "kara deliğe" yönlenmesine veya devasa döngülere girmesine yol açtı. Veri paketleri hedeflerine asla ulaşamadı.

Aşama 2: Zincirleme DNS ÇöküşüBGP sızıntısının yarattığı bu kaos, Microsoft'un kendi DNS hizmeti olan Azure DNS üzerinde muazzam bir yük oluşturdu. DNS, "https://www.google.com/search?q=google.com" gibi alan adlarını "172.217.14.228" gibi IP adreslerine çeviren sistemdir.

Trafik sunuculara ulaşamayınca, kullanıcıların cihazları ve uygulamaları sürekli olarak "https://www.google.com/search?q=teams.microsoft.com", "outlook.office.com" gibi adresleri tekrar tekrar sormaya başladı. Bu durum, Azure DNS sunucularının kapasitesini aşan bir "sorgu tsunamisi" yarattı. BGP sorunu kısmen çözülmeye başlansa bile, DNS altyapısı bu yük altında çöktü ve bu da "sağlıklı" olan sunucuların bile "bulunamaz" hale gelmesine neden oldu. Microsoft mühendisleri, hem hatalı BGP rotalarını geri çekmek hem de DNS hizmetini manuel olarak yeniden başlatmak için saatlerce mücadele etmek zorunda kaldı.

3. Ekonomik Etki: Dakikaların Milyar Dolarlık Maliyeti​

Bulut bilişimde kesinti süresi (downtime) doğrudan parayla ölçülür. Bu büyüklükteki bir çöküşün maliyeti dudak uçuklatıcıdır. Gartner gibi analiz firmalarının tahminlerine göre, kritik altyapı kesintilerinin dakikası, büyük işletmeler için yüz binlerce dolara mal olabiliyor.

Bu çöküşün ekonomik faturası birkaç katmandan oluştu:

  • Doğrudan Gelir Kaybı: Azure üzerinde çalışan e-ticaret siteleri, saatler boyunca sıfır satış yaptı.
  • Üretkenlik Kaybı: Dünya genelinde milyonlarca çalışan, Teams, Outlook veya bulut tabanlı yazılımlar çalışmadığı için iş yapamadı. Bu durum, küresel GSYİH üzerinde ölçülebilir bir etki yarattı.
  • SLA İhlalleri (Hizmet Seviyesi Anlaşmaları): Microsoft, müşterilerine %99.99 (bazen daha fazla) çalışma süresi taahhüt eder. Bu kesinti, bu taahhütlerin kitlesel olarak ihlal edilmesi anlamına geliyordu. Microsoft, şimdi müşterilerine milyonlarca dolarlık "hizmet kredisi" iadesi yapmak zorunda kalacak.
  • Piyasa Değeri: Haberin yayılmasıyla birlikte Microsoft (MSFT) hisseleri, piyasa sonrası işlemlerde geçici de olsa sert bir düşüş yaşadı.

4. Risk Tartışması: "Tüm Yumurtalar Aynı Sepette" mi?​

Bu mega çöküş, teknoloji endüstrisindeki en büyük tartışmalardan birini yeniden alevlendirdi: Merkeziyetçilik ve bulut bağımlılığı. AWS (Amazon), Google Cloud ve Azure (Microsoft) gibi "hiperskalacı" (hyperscaler) olarak bilinen bir avuç dev şirket, şu anda dijital dünyanın büyük bir kısmını kontrol ediyor.

Bu çöküş, "Bulut, sadece başkasının bilgisayarıdır" gerçeğini bir kez daha ortaya koydu. Şirketler, kendi sunucularını yönetme maliyetinden kurtulmak için buluta geçtiler, ancak şimdi tüm kontrollerini tek bir sağlayıcıya devretmenin riskleriyle yüzleşiyorlar.

Bu olayın, "multi-cloud" (çoklu bulut) ve "hybrid-cloud" (karma bulut) stratejilerini benimsemeyi hızlandırması bekleniyor. Multi-cloud, bir şirketin aynı anda hem Azure hem de AWS kullanarak, birinde sorun yaşandığında trafiği diğerine yönlendirebilmesi anlamına gelir. Ancak bu, teknik olarak çok daha karmaşık ve pahalı bir stratejidir.

Microsoft'un bu krizi nasıl yöneteceği, şeffaflıkla yayınlayacağı "post-mortem" (hata analizi raporu) ve gelecekte benzer BGP/DNS krizlerini önlemek için alacağı mimari önlemler, şirketin bulut pazarındaki liderliğini koruyup koruyamayacağını belirleyecek.

Sizce bu mega çöküş, şirketlerin "multi-cloud" (çoklu bulut) stratejilerine geçişini hızlandırır mı? Bu kadar büyük bir teknoloji devinin saatlerce çökmesi, 2024 yılı teknolojisi için kabul edilebilir bir risk mi? Yorumlarınızı bekliyoruz!
 
Bu Konuyu Okuyanlar (Toplam Okuyanlar 1)
Üst