VMware All Paths Down (APD) hatası, bir ESXi hostun bağlı olduğu storage aygıtına giden tüm erişim yollarını geçici olarak kaybettiğini ve datastore'a ulaşamadığını gösterir. Kısa cevap şudur: 14 Temmuz 2025 bağlamında APD durumunda önce bunun geçici bir path kaybı mı yoksa daha kalıcı bir storage olayı mı olduğunu ayırmak, ardından fabric, multipath, HBA ve storage controller tarafını birlikte incelemek gerekir. Bu rehber, APD olaylarını veri ve servis riski büyümeden analiz etmek isteyen ekipler için hazırlandı.
Bu rehber özellikle şu ekipler içindir:
- VMware yöneticileri
- storage ve SAN ekipleri
- veri merkezi operasyon ekipleri
- kritik datastore erişim kesintisi yaşayan BT ekipleri
Hızlı Özet
APD, hostun storage aygıtına giden bütün yolları geçici olarak kaybettiğini gösterir.- APD ile
Permanent Device Loss (PDL)aynı şey değildir; biri geçici erişim kaybı, diğeri kalıcı cihaz kaybı senaryosudur. - En sık nedenler SAN fabric problemi, iSCSI ağ kesintisi, multipath hatası, HBA sorunu veya storage controller erişim problemidir.
- APD sırasında VM davranışı, datastore tipi ve timeout politikalarına göre farklılaşabilir.
- Sorun yalnız ESXi üzerinde değil, çoğu zaman storage ve ağ katmanının kesişiminde oluşur.
- Bu yüzden teşhis akışı host logları ile storage olaylarını birlikte okumalıdır.
İçindekiler
- APD Hatası Ne Anlama Gelir?
- İlk 10 Dakikada Ne Kontrol Edilmeli?
- En Sık Görülen Nedenler Nelerdir?
- APD ile PDL Arasındaki Fark Nedir?
- Hangi Müdahaleler Daha Risklidir?
- Sorun Tekrarlamaması İçin Ne Yapılmalı?
- Hızlı Müdahale Kontrol Listesi
- Sık Sorulan Sorular

Görsel: Wikimedia Commons - cluttered server rack and networking equipment.
APD Hatası Ne Anlama Gelir?
APD, ESXi hostun bir storage device'a ulaşmak için kullanabildiği tüm path'leri kaybettiğini ancak cihazın mantıksal olarak tamamen kaybolduğunu henüz ilan etmediğini gösterir. Yani host cihazı hala potansiyel olarak geri gelebilecek bir kaynak gibi görür.
Bu durum şunlara yol açabilir:
- datastore erişiminde bekleme
- I/O gecikmesi veya blokaj
- bazı VM işlemlerinin takılması
- management katmanında storage alarmı
- cluster içinde failover veya operasyon gecikmesi
Bu nedenle APD'yi yalnız bir storage alarmı değil, servis devamlılığı riski olarak ele almak gerekir.
İlk 10 Dakikada Ne Kontrol Edilmeli?
İlk aşamada amaç, olayın kapsamını ayırmaktır. Şu sıra yararlıdır:
- Sorunun tek hostta mı yoksa birden fazla hostta mı yaşandığını kontrol edin.
- Etkilenen datastore veya device'ın hangi storage sistemine bağlı olduğunu netleştirin.
- FC, iSCSI veya NVMe/TCP gibi bağlantı türüne göre ilgili ağ veya fabric olaylarını inceleyin.
- Multipath durumu, HBA erişimi ve path health bilgisini kontrol edin.
- Storage controller, switch veya target port tarafında eşzamanlı alarm olup olmadığını doğrulayın.
Bu ilk ayrım, host tarafında görülen semptomun aslında storage tarafındaki daha büyük olayın parçası olup olmadığını gösterir.
En Sık Görülen Nedenler Nelerdir?
VMware All Paths Down (APD) hatasında en sık görülen nedenler şunlardır:
- SAN switch veya fabric kesintisi
- iSCSI ağında VLAN, MTU veya uplink problemi
- HBA veya NIC erişim sorunu
- storage controller failover veya controller erişim kaybı
- multipath yapılandırma problemi
- host ile target arasındaki geçici bağlantı kopması
Broadcom bilgi bankasında APD'nin, hostun storage device'a tüm erişim yollarını kaybettiği ama cihazın kalıcı olarak kaybolduğunun henüz anlaşılmadığı bir durum olduğu açıkça tanımlanıyor. Bu da APD olaylarında storage tarafının geri dönüş ihtimalinin dikkate alınması gerektiğini gösteriyor.
APD ile PDL Arasındaki Fark Nedir?
APD ve PDL karıştırılmamalıdır:
APD: host tüm path'leri kaybetmiştir, ancak cihazın geri dönme ihtimali vardır.PDL: storage tarafı cihazın artık mevcut olmadığını veya erişilemez olduğunu açık biçimde bildirir.
Bu fark önemlidir çünkü recovery yaklaşımı değişir. APD olayında bağlantı geri gelebilir; PDL'de ise cihazın sunumu veya storage konfigürasyonu kalıcı olarak değişmiş olabilir.
Hangi Müdahaleler Daha Risklidir?
Daha güvenli yaklaşım:
- etki alanını host ve datastore bazında netleştirmek
- storage ve ağ olaylarını eş zamanlı okumak
- multipath ve controller durumunu doğrulamak
- PDL ile APD ayrımını yapmadan agresif storage işlemi uygulamamak
Daha riskli yaklaşım:
- kök nedeni görmeden datastore'u aceleyle remount etmeye çalışmak
- storage tarafında plansız LUN değişikliği yapmak
- fabric ya da iSCSI ağı incelenmeden yalnız ESXi üzerinde işlem yapmak
- controller failover senaryosu netleşmeden büyük çaplı restart zinciri başlatmak
Amaç, storage erişimini geri getirirken veri yolu istikrarını daha fazla bozmamaktır.
Sorun Tekrarlamaması İçin Ne Yapılmalı?
Kalıcı çözüm için şu alanlar gözden geçirilmelidir:
- multipath tasarımı ve path çeşitliliği
- storage ağında MTU ve VLAN standardı
- SAN switch ve controller olay izleme disiplini
- HBA/NIC firmware ve driver uyumu
- datastore bağımlılık haritası
- APD/PDL alarm eşikleri ve operasyon runbook'u
Tekrarlayan APD olayları genellikle altyapı katmanları arasında görünmeyen bir kırılganlık olduğunu gösterir.
Hızlı Müdahale Kontrol Listesi
- Etkilenen host ve datastore kapsamını belirleyin.
- Storage bağlantı tipine göre ilgili ağ veya fabric olaylarını inceleyin.
- Multipath ve HBA/NIC health bilgisini doğrulayın.
- Storage controller veya target port alarmı olup olmadığını kontrol edin.
- APD ile PDL ayrımını netleştirin.
- Olay sonrası path tasarımı ve izleme standardını güncelleyin.
İlgili İçerikler
LeonX ile Sonraki Adım
APD olaylarında kalıcı çözüm yalnız alarmı kapatmak değildir. LeonX, VMware storage erişim zincirinizi host, path, ağ ve storage controller katmanlarında birlikte değerlendirerek daha dayanıklı bir işletim modeli kurmanıza yardımcı olur.
İlgili sayfalar:
Sık Sorulan Sorular
VMware APD ne demektir?
ESXi hostun storage aygıtına giden tüm yolları kaybettiği ancak cihazın tamamen yok olduğunun henüz kesinleşmediği durumu ifade eder.
APD ile PDL aynı şey mi?
Hayır. APD geçici veya geri dönebilen path kaybı senaryosudur; PDL ise cihazın kalıcı olarak kaybolduğunun storage tarafından bildirildiği durumdur.
En sık neden nedir?
SAN fabric problemi, iSCSI ağ kesintisi, multipath hatası ve controller erişim sorunu en sık nedenler arasındadır.
APD sırasında VM'ler hemen kapanır mı?
Her zaman değil. Davranış datastore türü, timeout politikası ve I/O durumuna göre değişebilir; bazı VM işlemleri beklemeye girebilir.
Kalıcı önlem için ne yapılmalı?
Path tasarımı, ağ standardı, firmware uyumu ve storage olay görünürlüğü güçlendirilmelidir.
Sonuç
VMware All Paths Down (APD) hatası, host ile storage arasındaki erişim zincirinin tamamının geçici olarak koptuğunu gösterir. 14 Temmuz 2025 bağlamında en doğru yaklaşım; etki alanını hızla ayırmak, APD ile PDL farkını netleştirmek ve host, ağ, multipath ile storage controller katmanlarını aynı olay çerçevesinde incelemektir.



