VMware vSAN Health Error, vSAN cluster içinde kapasite, network, disk, HCL, object health, performans servisi veya vSAN Health servis katmanlarından birinde normal dışı durum olduğunu gösterir. Hata her zaman veri kaybı anlamına gelmez; ancak cluster'ın beklenen dayanıklılık, uyumluluk veya izlenebilirlik seviyesinden saptığını gösterdiği için sistematik ele alınmalıdır. Kısa cevap şudur: önce alarmın hangi vSAN Health kategorisinden geldiğini ayırın, sonra host, disk group, network, HCL, resync, object compliance ve vCenter tarafındaki vmware-vsan-health servis durumunu birlikte kontrol edin.
Bu rehber özellikle şu ekipler içindir:
- VMware vSAN cluster yöneten sanallaştırma ekipleri
- storage, network ve veri merkezi operasyon ekipleri
- vSAN uyarılarını bakım penceresi öncesinde kapatmak isteyen sistem yöneticileri
- HCL, firmware, disk ve network kaynaklı vSAN Health hatalarını ayırmak isteyen kurumlar
Hızlı Özet
- Broadcom KB
326438, vSAN Health Service check'lerini capacity, cluster, data, hardware compatibility, network, physical disk ve proactive tests gibi çok sayıda kategoriye ayırır. VMware vSAN Health Errortek bir hata değildir; önce kırmızı veya sarı olan test ailesi bulunmalıdır.- vSAN Health servisi başlamıyorsa veya GUI health bilgisini gösteremiyorsa sorun cluster'dan önce vCenter servis katmanında olabilir.
- HCL, SCSI controller, firmware, driver ve physical NIC kontrolleri bakım veya vLCM remediation akışını durdurabilir.
- Network health tarafında küçük ping, büyük ping, MTU, connectivity, partition ve latency testleri ayrı değerlendirilmelidir.
- Güvenli müdahale, alarmı susturmak değil; doğrulama, log, resync etkisi ve bakım modu riskini aynı kayıt altında kapatmaktır.
İçindekiler
- vSAN Health Error Ne Anlama Gelir?
- İlk 10 Dakikada Hangi Kontroller Yapılmalı?
- vSAN Health Servisi Çalışıyor mu?
- Disk, HCL ve Firmware Hataları Nasıl Ayrılır?
- Network Health Error Nasıl İncelenir?
- Resync ve Object Compliance Ne Zaman Kritikleşir?
- Kalıcı Önleme Planı
- İlgili İçerikler
- Kontrol Listesi
- LeonX ile Sonraki Adım
- Sık Sorulan Sorular
- Kaynaklar

Görsel: Wikimedia Commons - IBM System Storage DCS3700, j_cadmus, CC BY 2.0. WebP formatına optimize edilmiştir.
vSAN Health Error Ne Anlama Gelir?
vSAN Health Error, vSAN'ın kendi sağlık testlerinden en az birinin beklenen sonucu üretmediğini anlatır. Bu uyarı bazen gerçek veri erişilebilirliği riski, bazen bakım öncesi uyumluluk problemi, bazen de health bilgisini toplayan servis katmanında hata anlamına gelebilir.
Broadcom KB 326438, vSAN Health Service check'lerini şu ana ailelerde toplar:
| Health ailesi | Tipik hata | İlk ayrım |
|---|---|---|
| Capacity Utilization | düşük boş alan, limit yaklaşımı | kapasite ve component sayısı |
| Cluster | disk format, config consistency, time sync | hostlar arası parite |
| Data | object health, object format | policy ve erişilebilirlik |
| Hardware Compatibility | controller, firmware, disk, NIC | HCL ve driver uyumu |
| Network | MTU, connectivity, partition, latency | VMkernel ve fiziksel ağ |
| Physical Disk | disk health, congestion, metadata | cache/capacity device etkisi |
| Performance Service | stats collection, performance object | metrik görünürlüğü |
Bu nedenle VMware vSAN Cluster Degraded Sorunu daha çok cluster dayanıklılığına odaklanırken, bu yazı vSAN Health Error uyarısını kategori bazında ayırma ve güvenli müdahale akışına odaklanır.
İlk 10 Dakikada Hangi Kontroller Yapılmalı?
İlk müdahale, alarmı susturmak veya hostu hemen maintenance mode'a almak olmamalıdır. Güvenli başlangıç sırası:
- vSphere Client üzerinde
Cluster > Monitor > vSAN > Skyline Healthyolunda kırmızı veya sarı test adını kaydedin. - Hatanın capacity, network, physical disk, hardware compatibility, data veya service katmanından geldiğini ayırın.
- Son
24 saatiçinde vLCM remediation, firmware update, host reboot, disk değişimi, network değişikliği veya sertifika yenileme olup olmadığını kontrol edin. - Resyncing components sayısını ve tahmini bitiş süresini inceleyin.
- Object compliance durumunu kritik VM'ler için ayrıca doğrulayın.
- vCenter tarafında vSAN Health servis durumu ve ilgili log dosyalarını kontrol edin.
- Tek host mu, tüm cluster mı, belirli disk group mu etkilendiğini ayırın.
Bu yaklaşım Donanım & Yazılım Hizmetleri altında yürütülen sanallaştırma ve depolama operasyonlarıyla doğrudan ilişkilidir. Özellikle Depolama Kapasite Planlama ve Performans Optimizasyonu vSAN health sinyallerini kapasite, performans ve bakım standardıyla birlikte ele alır.
vSAN Health Servisi Çalışıyor mu?
Bazı senaryolarda sorun vSAN veri katmanından değil, vCenter üzerindeki vSAN Health servisinden kaynaklanır. Broadcom KB 433327, vSAN Health servisinin farklı vCenter sürümlerinde neden başlamayabileceğini ve hangi log belirtilerinin ayırıcı olduğunu özetler.
Kontrol edilmesi gerekenler:
service-control --status vmware-vsan-healthçıktısı/var/log/vmware/vsan-health/altındaki servis logları- vCenter upgrade veya certificate değişikliği geçmişi
envoy,vpxd-svcs,vpostgresvevsanvcmgmtdloglarında hata izi- vSAN ekranlarının vSphere Client içinde tamamen kaybolup kaybolmadığı
Eğer Health servisi başlamıyorsa, cluster gerçekten sağlıksız olduğu için değil, health bilgisini toplayan servis çalışmadığı için hata görülebilir. Bu ayrım özellikle bakım penceresi öncesi önemlidir; yanlışlıkla host veya disk müdahalesi yapmak yerine önce servis katmanı netleştirilmelidir.
Disk, HCL ve Firmware Hataları Nasıl Ayrılır?
vSAN Health Error uyarılarının önemli bir bölümü donanım uyumluluğu veya fiziksel disk tarafında çıkar. Broadcom KB 404723, ESXi upgrade pre-check veya remediation adımının SCSI controller is VMware certified gibi vSAN health alert nedeniyle durabileceğini gösterir.
Disk ve HCL tarafında şu ayrım yapılmalıdır:
- SCSI controller vSAN HCL içinde mi?
- controller firmware ve driver sürümü desteklenen kombinasyonda mı?
- cache device veya capacity device üzerinde SMART, wear, latency veya congestion belirtisi var mı?
- disk group layout beklenen gibi mi?
- storage controller üzerinde vSAN ve non-vSAN diskler birlikte mi kullanılıyor?
- alert gerçekten doğrulandı mı, yoksa eski HCL verisi veya geçici health sonucu mu?
Broadcom'un ilgili KB'sindeki önemli operasyon dersi şudur: alert ancak uyumluluk pozitif doğrulandıktan sonra susturulmalıdır. Yani "Silence Alert" bir çözüm değil, kanıtlandıktan sonra kullanılan operasyon adımıdır.
Bu başlık VMware vSAN Disk Grupları Nasıl Çalışır?, VMware vSAN Architecture Deep Dive ve VMware Storage Policy Nedir? içerikleriyle birlikte okunmalıdır.
Network Health Error Nasıl İncelenir?
vSAN network hataları storage problemi gibi görünebilir; fakat kök neden VMkernel, MTU, VLAN, physical NIC, driver veya switch tarafında olabilir. Broadcom KB 326438, network health altında küçük ping, büyük ping, MTU check, connectivity, unexpected members, partition ve latency testlerini ayrı başlıklar olarak listeler.
Network tarafında hızlı ayrım:
- tüm hostlarda vSAN enabled VMkernel adapter var mı?
- vSAN VMkernel IP'leri doğru VLAN'da mı?
- küçük ping çalışırken büyük ping veya MTU testi hata veriyor mu?
- vSAN cluster partition uyarısı var mı?
- fiziksel NIC link speed, error rate veya driver/firmware uyarısı var mı?
- RDMA/RoCE kullanılan ortamlarda NIC sertifikasyonu doğru mu?
vSAN network sağlığı, Network İzleme ve Yönetimi ile de operasyonel olarak izlenmelidir. Storage alarmı gibi görünen birçok olay, aslında network packet loss, MTU farkı veya latency kaynaklı olabilir. İlgili arka plan için VMware Network Yapısı Nasıl Çalışır? ve VMware VLAN Konfigürasyonu Nasıl Yapılır? yazıları tamamlayıcıdır.
Resync ve Object Compliance Ne Zaman Kritikleşir?
vSAN Health Error ile birlikte resync veya object compliance uyarısı varsa, müdahale daha dikkatli planlanmalıdır. Çünkü bir hostu bakım moduna almak, disk değiştirmek veya network üzerinde ek değişiklik yapmak mevcut toparlanma sürecini ağırlaştırabilir.
Kritikleşme işaretleri:
- resync kuyruğu uzun süredir azalmıyor
- object compliance kritik VM'lerde bozuk
- capacity free space düşük
- birden fazla host veya disk group etkilenmiş
- bakım modu
Ensure Accessibilityseçeneğiyle bile riskli görünüyor - performans grafikleri resync sırasında yüksek latency gösteriyor
Bu durumda hedef, alarmı hızlıca kapatmak değil, veri dayanıklılığını daha fazla zayıflatmadan toparlanma yolunu yönetmektir. VMware vSAN Performance Optimization Rehberi resync, network ve workload baskısını performans penceresiyle birlikte yorumlamak için yararlıdır.
Kalıcı Önleme Planı
1-7 gün: Görünürlük
- vSAN Health kategori raporu çıkarılır.
- Son
30 güniçindeki recurring health uyarıları gruplandırılır. - vCenter
vmware-vsan-healthservis logları ve ESXi host logları saklanır. - En kritik VM'ler için object compliance örneklemesi yapılır.
8-20 gün: Standartlaştırma
- HCL, firmware, driver ve controller standardı güncellenir.
- vSAN network VLAN, MTU, NIC teaming ve switch trunk standardı belgelenir.
- Capacity threshold ve resync alarm eşiği operasyon ekibiyle netleştirilir.
- Bakım modu prosedürüne health pre-check maddesi eklenir.
21-30 gün: Test ve kanıt
- Proactive VM creation test ve network performance test sonuçları saklanır.
- Bakım öncesi ve bakım sonrası vSAN Health çıktısı karşılaştırılır.
- Tekrarlayan alarm için root cause ve aksiyon sahibi atanır.
- Gerektiğinde Broadcom support bundle hazırlanır.
Broadcom KB 327035, vSAN support loglarının toplanması ve Broadcom VCF Support'a yüklenmesi için yol gösterir. Kritik olaylarda yalnız ekran görüntüsü değil, log seti ve zaman çizelgesi de hazırlanmalıdır.
İlgili İçerikler
- VMware vSAN Cluster Degraded Sorunu Nasıl Çözülür?
- VMware vSAN Performance Optimization Rehberi
- VMware vSAN Disk Grupları Nasıl Çalışır?
- VMware vSAN Architecture Deep Dive
- VMware vSAN vs Traditional SAN Karşılaştırma
- VMware Storage Policy Nedir?
Kontrol Listesi
- Kırmızı veya sarı health testinin tam adı kaydedildi
- Hata capacity, cluster, data, HCL, network, physical disk veya service kategorisine ayrıldı
- vCenter
vmware-vsan-healthservis durumu kontrol edildi - Disk group, cache device ve capacity device sağlığı incelendi
- HCL, firmware ve driver kombinasyonu doğrulandı
- vSAN VMkernel, VLAN, MTU ve physical NIC durumu kontrol edildi
- Resyncing components ve object compliance bilgisi incelendi
- Bakım modu veya remediation öncesi health pre-check alındı
- Alarm susturulduysa doğrulama kanıtı kaydedildi
- Support bundle ve olay zaman çizelgesi hazırlandı
LeonX ile Sonraki Adım
VMware vSAN Health Error, tek bir alarm ekranı olarak değil; storage, network, firmware, policy ve vCenter servis katmanlarının ortak sağlık sinyali olarak ele alınmalıdır. LeonX, Donanım & Yazılım Hizmetleri kapsamında Depolama Kapasite Planlama ve Performans Optimizasyonu, NAS / SAN Depolama Kurulum ve Yapılandırma ve Kurumsal Sanallaştırma Platformları Satış ve Lisanslama ile vSAN health sinyallerini kalıcı operasyon standardına bağlar.
Network görünürlüğü için İş ve Yönetim Hizmetleri altındaki Network İzleme ve Yönetimi de tamamlayıcıdır. Mevcut vSAN cluster'ınızı değerlendirmek veya teklif almak için İletişim sayfasından ilerleyebilirsiniz.
İlgili sayfalar:
- Donanım & Yazılım Hizmetleri
- Depolama Kapasite Planlama ve Performans Optimizasyonu
- NAS / SAN Depolama Kurulum ve Yapılandırma
- Network İzleme ve Yönetimi
- İletişim
Sık Sorulan Sorular
VMware vSAN Health Error veri kaybı anlamına mı gelir?
Her zaman değil. Bazı health error'lar uyumluluk, servis, network veya HCL kaynaklıdır. Ancak object health veya resync ile birlikte görülüyorsa veri dayanıklılığı etkilenmiş olabilir.
vSAN Health alarmı susturulabilir mi?
Evet, ancak yalnız doğrulama yapıldıktan sonra. HCL veya firmware gibi uyarılarda alarmı susturmak kök nedeni çözmez; sadece doğrulanmış istisnayı görünür alarm listesinden çıkarır.
vSAN Health servisi çalışmıyorsa ne yapılmalı?
Önce vCenter üzerinde vmware-vsan-health servis durumu ve ilgili loglar kontrol edilmelidir. Servis başlamıyorsa cluster'a müdahale etmeden önce vCenter servis katmanı ayrıştırılmalıdır.
Network hatası storage problemi gibi görünebilir mi?
Evet. MTU farkı, packet loss, partition veya latency vSAN tarafında data veya cluster health hatasına dönüşebilir.
Bakım öncesi en kritik kontrol nedir?
Bakım öncesinde vSAN Health, resyncing components, object compliance, kapasite boşluğu ve host maintenance mode seçeneği birlikte kontrol edilmelidir.
Kaynaklar
- Broadcom KB 326438 - vSAN Health Service Check Information
- Broadcom KB 433327 - vSAN health service fails to start on vCenter Server
- Broadcom KB 404723 - ESXi upgrade pre-check fails due to degraded vSAN health
- Broadcom KB 327035 - How to collect vSAN support logs and upload to Broadcom VCF Support
- Broadcom Developer - vSAN Management API
- Wikimedia Commons - IBM System Storage DCS3700



