VMware ESXi host PSOD yani Purple Screen of Death hatası, host çekirdek seviyesinde kritik bir sorun yaşadığını ve normal işletim akışını sürdüremediğini gösterir. Kısa cevap şudur: 28 Nisan 2025 bağlamında PSOD görüldüğünde ilk amaç host’u rastgele yeniden başlatmak değil, ekran üzerindeki hata bilgisini korumak, etki alanını anlamak, workload durumunu değerlendirmek ve donanım, sürücü, firmware ya da kernel seviyesindeki kök nedeni ayırmaktır. Bu rehber, ESXi PSOD olayını kontrollü ve güvenli şekilde ele almak isteyen ekipler için hazırlandı.
Bu rehber özellikle şu ekipler içindir:
- VMware yöneticileri
- veri merkezi ve sistem operasyon ekipleri
- donanım ve altyapı uzmanları
- kritik host arızası yaşayan BT ekipleri
Hızlı Özet
- PSOD, sıradan bağlantı hatasından daha ağır bir host seviyeli olaydır.
- İlk iş, hata ekranındaki bilgiyi kaybetmeden belgelemektir.
- Donanım, sürücü, firmware ve kernel uyumsuzluğu sık nedenler arasındadır.
- Hemen rastgele reboot etmek analiz fırsatını yok edebilir.
- Aynı cluster içindeki diğer hostlar da risk açısından kontrol edilmelidir.
- Bu nedenle doğru yaklaşım, panik değil kontrollü kriz yönetimidir.
İçindekiler
- ESXi PSOD Nedir ve Ne Anlama Gelir?
- İlk 10 Dakikada Ne Yapılmalı?
- En Sık Görülen Nedenler Nelerdir?
- Reboot Ne Zaman Düşünülmeli?
- Sorun Tekrarlamaması İçin Ne Yapılmalı?
- Hızlı Müdahale Kontrol Listesi
- Sık Sorulan Sorular

Görsel: Wikimedia Commons - Data Center 3 (UNC).
ESXi PSOD Nedir ve Ne Anlama Gelir?
PSOD, ESXi hypervisor’ın kritik kernel seviyesi bir hata nedeniyle güvenli şekilde durduğunu gösterir. Bu durum genelde şu katmanlardan biriyle ilişkilidir:
- donanım arızası
- sürücü veya firmware uyumsuzluğu
- bellek veya CPU ile ilgili kritik hata
- belirli I/O veya storage davranışları
- kernel seviyesinde beklenmeyen exception durumu
Bu olay, sıradan management erişim kaybından farklıdır; çünkü doğrudan host işletim çekirdeği etkilenir.
İlk 10 Dakikada Ne Yapılmalı?
PSOD anında en kritik hata, ekranı veya hata bilgisini kaybetmektir. Bu yüzden ilk aşamada şu akış izlenmelidir:
- Ekrandaki PSOD mesajını, exception numarasını ve ilgili modül bilgisini fotoğraf veya kayıt ile koruyun.
- Etkilenen host üzerindeki workload ve cluster etkisini belirleyin.
- HA davranışı, VM yeniden başlatmaları ve bağlı servis etkisini doğrulayın.
- Aynı donanım veya aynı sürücü setine sahip diğer hostlarda risk olup olmadığını inceleyin.
- Out-of-band erişim logları ve donanım olay kayıtlarını koruyun.
Bu ilk adımlar, kök neden analizini mümkün kılar ve gereksiz tekrar riskini azaltır.
En Sık Görülen Nedenler Nelerdir?
ESXi PSOD olaylarının en sık görülen nedenleri şunlardır:
- sürücü ve firmware uyumsuzluğu
- fiziksel memory veya CPU problemi
- donanım üretici uyumluluk dışı kombinasyonlar
- storage veya HBA sürücü sorunları
- network driver bug’ları
- nadiren yoğun kernel seviyeli I/O baskısı
Özellikle yakın dönemde yapılan firmware, driver veya host patch değişiklikleri önemli ipucu sağlar.
Reboot Ne Zaman Düşünülmeli?
Bir PSOD sonrasında host’u tekrar ayağa kaldırmak çoğu zaman gerekir; ancak önce eldeki tanı bilgisinin korunması önemlidir. Güvenli yaklaşım şu mantıkla ilerler:
- hata ekranı ve log bilgisi toplandı mı
- cluster diğer workload’ları karşılıyor mu
- aynı imaja sahip diğer hostlar risk altında mı
- donanım olay kaydı incelendi mi
Daha riskli yaklaşım ise bilgiyi toplamadan hızlı reboot etmek ve kök neden ipucunu kaybetmektir. Reboot operasyonel olarak gerekebilir, ama analiz öncesi refleks haline gelmemelidir.
Sorun Tekrarlamaması İçin Ne Yapılmalı?
Kalıcı çözüm için yalnız host’u tekrar açmak yetmez. Şu alanlar sistematik olarak gözden geçirilmelidir:
- vendor compatibility ve HCL uyumu
- firmware ve driver sürüm eşleşmesi
- donanım sağlık kayıtları
- memory ve CPU hata geçmişi
- storage ve network adapter davranışı
- son değişiklik geçmişi
Tekrarlayan PSOD olayları genellikle ya uyumluluk ya da donanım sağlığı problemine işaret eder.
Hızlı Müdahale Kontrol Listesi
- PSOD ekranındaki mesajı ve modül bilgisini kaydedin.
- Host üzerindeki workload etkisini ve HA davranışını değerlendirin.
- Out-of-band donanım loglarını ve olay kayıtlarını alın.
- Son firmware, driver ve patch değişikliklerini kontrol edin.
- Aynı profile sahip diğer hostları risk açısından gözden geçirin.
- Reboot öncesi tanı bilgisinin korunduğundan emin olun.
İlgili İçerikler
LeonX ile Sonraki Adım
PSOD olaylarında doğru sıralama, yalnız host’u ayağa kaldırmaktan daha önemlidir; çünkü aynı sorunun tekrar etmesini engelleyen şey kök neden disiplinidir. LeonX, VMware ortamınızda host sağlık verileri, firmware/driver uyumu, cluster davranışı ve operasyon kayıtlarını birlikte ele alarak daha dayanıklı bir platform kurmanıza yardımcı olur.
İlgili sayfalar:
Sık Sorulan Sorular
ESXi PSOD ne demektir?
Hypervisor çekirdeğinin kritik hata nedeniyle güvenli şekilde durmasıdır.
İlk yapılması gereken şey nedir?
Ekrandaki hata bilgisini ve modül detayını kaybetmeden kaydetmektir.
Hemen reboot etmek doğru mu?
Her zaman değil. Önce tanı bilgisi ve etki analizi korunmalıdır.
PSOD’nin en sık nedeni nedir?
Sıklıkla sürücü, firmware ve donanım uyumluluk sorunları öne çıkar.
Sorunun tekrar etmesi nasıl önlenir?
HCL uyumu, firmware/driver eşleşmesi ve donanım sağlık kayıtları birlikte incelenmelidir.
Sonuç
VMware ESXi host PSOD olayı, sıradan bir erişim probleminden daha ağır ve daha derin bir host seviyesi arızayı gösterir. 28 Nisan 2025 bağlamında en doğru yaklaşım; hata bilgisini korumak, etkiyi yönetmek, kök nedeni uyumluluk ve donanım katmanında analiz etmek ve aynı riski diğer hostlar için de değerlendirmektir.



