VMware All Paths Down (APD) Hatası Nasıl Çözülür? (2025)

VMware All Paths Down (APD) hatası, bir ESXi hostun bağlı olduğu storage aygıtına giden tüm erişim yollarını geçici olarak kaybettiğini ve datastore'a ulaşamadığını gösterir. Kısa cevap şudur: APD durumunda önce bunun geçici bir path kaybı mı yoksa daha kalıcı bir storage olayı mı olduğunu ayırmak, ardından fabric, multipath, HBA ve storage controller tarafını birlikte incelemek gerekir. Bu rehber, APD olaylarını veri ve servis riski büyümeden analiz etmek isteyen ekipler için hazırlandı.

Bu rehber özellikle şu ekipler içindir:

VMware yöneticileri
storage ve SAN ekipleri
veri merkezi operasyon ekipleri
kritik datastore erişim kesintisi yaşayan BT ekipleri

Hızlı Özet

APD, hostun storage aygıtına giden bütün yolları geçici olarak kaybettiğini gösterir.
APD ile Permanent Device Loss (PDL) aynı şey değildir; biri geçici erişim kaybı, diğeri kalıcı cihaz kaybı senaryosudur.
En sık nedenler SAN fabric problemi, iSCSI ağ kesintisi, multipath hatası, HBA sorunu veya storage controller erişim problemidir.
APD sırasında VM davranışı, datastore tipi ve timeout politikalarına göre farklılaşabilir.
Sorun yalnız ESXi üzerinde değil, çoğu zaman storage ve ağ katmanının kesişiminde oluşur.
Bu yüzden teşhis akışı host logları ile storage olaylarını birlikte okumalıdır.

VMware APD rehberi için storage ve ağ ekipmanı görseli

Görsel: Wikimedia Commons - cluttered server rack and networking equipment.

APD Hatası Ne Anlama Gelir?

APD, ESXi hostun bir storage device'a ulaşmak için kullanabildiği tüm path'leri kaybettiğini ancak cihazın mantıksal olarak tamamen kaybolduğunu henüz ilan etmediğini gösterir. Yani host cihazı hala potansiyel olarak geri gelebilecek bir kaynak gibi görür.

Bu durum şunlara yol açabilir:

datastore erişiminde bekleme
I/O gecikmesi veya blokaj
bazı VM işlemlerinin takılması
management katmanında storage alarmı
cluster içinde failover veya operasyon gecikmesi

Bu nedenle APD'yi yalnız bir storage alarmı değil, servis devamlılığı riski olarak ele almak gerekir.

İlk 10 Dakikada Ne Kontrol Edilmeli?

İlk aşamada amaç, olayın kapsamını ayırmaktır. Şu sıra yararlıdır:

Sorunun tek hostta mı yoksa birden fazla hostta mı yaşandığını kontrol edin.
Etkilenen datastore veya device'ın hangi storage sistemine bağlı olduğunu netleştirin.
FC, iSCSI veya NVMe/TCP gibi bağlantı türüne göre ilgili ağ veya fabric olaylarını inceleyin.
Multipath durumu, HBA erişimi ve path health bilgisini kontrol edin.
Storage controller, switch veya target port tarafında eşzamanlı alarm olup olmadığını doğrulayın.

Bu ilk ayrım, host tarafında görülen semptomun aslında storage tarafındaki daha büyük olayın parçası olup olmadığını gösterir.

En Sık Görülen Nedenler Nelerdir?

VMware All Paths Down (APD) hatasında en sık görülen nedenler şunlardır:

SAN switch veya fabric kesintisi
iSCSI ağında VLAN, MTU veya uplink problemi
HBA veya NIC erişim sorunu
storage controller failover veya controller erişim kaybı
multipath yapılandırma problemi
host ile target arasındaki geçici bağlantı kopması

Broadcom bilgi bankasında APD'nin, hostun storage device'a tüm erişim yollarını kaybettiği ama cihazın kalıcı olarak kaybolduğunun henüz anlaşılmadığı bir durum olduğu açıkça tanımlanıyor. Bu da APD olaylarında storage tarafının geri dönüş ihtimalinin dikkate alınması gerektiğini gösteriyor.

APD ile PDL Arasındaki Fark Nedir?

APD ve PDL karıştırılmamalıdır:

APD: host tüm path'leri kaybetmiştir, ancak cihazın geri dönme ihtimali vardır.
PDL: storage tarafı cihazın artık mevcut olmadığını veya erişilemez olduğunu açık biçimde bildirir.

Bu fark önemlidir çünkü recovery yaklaşımı değişir. APD olayında bağlantı geri gelebilir; PDL'de ise cihazın sunumu veya storage konfigürasyonu kalıcı olarak değişmiş olabilir.

Hangi Müdahaleler Daha Risklidir?

Daha güvenli yaklaşım:

etki alanını host ve datastore bazında netleştirmek
storage ve ağ olaylarını eş zamanlı okumak
multipath ve controller durumunu doğrulamak
PDL ile APD ayrımını yapmadan agresif storage işlemi uygulamamak

Daha riskli yaklaşım:

kök nedeni görmeden datastore'u aceleyle remount etmeye çalışmak
storage tarafında plansız LUN değişikliği yapmak
fabric ya da iSCSI ağı incelenmeden yalnız ESXi üzerinde işlem yapmak
controller failover senaryosu netleşmeden büyük çaplı restart zinciri başlatmak

Amaç, storage erişimini geri getirirken veri yolu istikrarını daha fazla bozmamaktır.

Sorun Tekrarlamaması İçin Ne Yapılmalı?

Kalıcı çözüm için şu alanlar gözden geçirilmelidir:

multipath tasarımı ve path çeşitliliği
storage ağında MTU ve VLAN standardı
SAN switch ve controller olay izleme disiplini
HBA/NIC firmware ve driver uyumu
datastore bağımlılık haritası
APD/PDL alarm eşikleri ve operasyon runbook'u

Tekrarlayan APD olayları genellikle altyapı katmanları arasında görünmeyen bir kırılganlık olduğunu gösterir.

Hızlı Müdahale Kontrol Listesi

Etkilenen host ve datastore kapsamını belirleyin.
Storage bağlantı tipine göre ilgili ağ veya fabric olaylarını inceleyin.
Multipath ve HBA/NIC health bilgisini doğrulayın.
Storage controller veya target port alarmı olup olmadığını kontrol edin.
APD ile PDL ayrımını netleştirin.
Olay sonrası path tasarımı ve izleme standardını güncelleyin.

İlgili İçerikler

LeonX ile Sonraki Adım

APD olaylarında kalıcı çözüm yalnız alarmı kapatmak değildir. LeonX, VMware storage erişim zincirinizi host, path, ağ ve storage controller katmanlarında birlikte değerlendirerek daha dayanıklı bir işletim modeli kurmanıza yardımcı olur.

İlgili sayfalar:

Sık Sorulan Sorular

VMware APD ne demektir?

ESXi hostun storage aygıtına giden tüm yolları kaybettiği ancak cihazın tamamen yok olduğunun henüz kesinleşmediği durumu ifade eder.

APD ile PDL aynı şey mi?

Hayır. APD geçici veya geri dönebilen path kaybı senaryosudur; PDL ise cihazın kalıcı olarak kaybolduğunun storage tarafından bildirildiği durumdur.

En sık neden nedir?

SAN fabric problemi, iSCSI ağ kesintisi, multipath hatası ve controller erişim sorunu en sık nedenler arasındadır.

APD sırasında VM'ler hemen kapanır mı?

Her zaman değil. Davranış datastore türü, timeout politikası ve I/O durumuna göre değişebilir; bazı VM işlemleri beklemeye girebilir.

Kalıcı önlem için ne yapılmalı?

Path tasarımı, ağ standardı, firmware uyumu ve storage olay görünürlüğü güçlendirilmelidir.

Sonuç

VMware All Paths Down (APD) hatası, host ile storage arasındaki erişim zincirinin tamamının geçici olarak koptuğunu gösterir. 14 Temmuz 2025 bağlamında en doğru yaklaşım; etki alanını hızla ayırmak, APD ile PDL farkını netleştirmek ve host, ağ, multipath ile storage controller katmanlarını aynı olay çerçevesinde incelemektir.

Kaynaklar

Paylaş

Facebook

Twitter

İlgili Yazılar

Benzer konular hakkında daha fazlasını keşfedin

Dell Server Overheating Sorunu Nasıl Çözülür?

Hardware & Software

2026-06-04

15 dk okuma

Dell Server Overheating Sorunu Nasıl Çözülür?

Dell PowerEdge sunucularda overheating sorununu iDRAC sıcaklık olayları, inlet temperature, fan profili, hava akışı, rack soğutması ve firmware kontrolleriyle çözme rehberi.

Devamını Oku

Dell Server Fan Failure Hatası Nasıl Çözülür?

Hardware & Software

2026-06-02

15 dk okuma

Dell Server Fan Failure Hatası Nasıl Çözülür?

Dell Server Fan Failure hatasını; iDRAC FAN olay kodları, Lifecycle Log, fiziksel fan kontrolü, hava akışı, firmware ve OpenManage izleme akışıyla açıklayan rehber.

Devamını Oku

Hardware & Software

2026-06-01

15 dk okuma

VMware vSAN Health Error Nasıl Çözülür?

VMware vSAN Health Error uyarısını; health kategorileri, vSAN Health servisi, disk, network, HCL, resync ve destek loglarıyla sistematik analiz eden rehber.

Devamını Oku

VMware All Paths Down (APD) Hatası Nasıl Çözülür? (2025)

Hızlı Özet

İçindekiler

APD Hatası Ne Anlama Gelir?

İlk 10 Dakikada Ne Kontrol Edilmeli?

En Sık Görülen Nedenler Nelerdir?

APD ile PDL Arasındaki Fark Nedir?

Hangi Müdahaleler Daha Risklidir?

Sorun Tekrarlamaması İçin Ne Yapılmalı?

Hızlı Müdahale Kontrol Listesi

İlgili İçerikler

LeonX ile Sonraki Adım

Sık Sorulan Sorular

VMware APD ne demektir?

APD ile PDL aynı şey mi?

En sık neden nedir?

APD sırasında VM'ler hemen kapanır mı?

Kalıcı önlem için ne yapılmalı?

Sonuç

Kaynaklar

Bu konu için ilgili hizmet sayfalarına geçin

Paylaş

İlgili Yazılar

Dell Server Overheating Sorunu Nasıl Çözülür?

Dell Server Fan Failure Hatası Nasıl Çözülür?

VMware vSAN Health Error Nasıl Çözülür?

Bültene Abone Olun