Blog'a Dön
Hardware & Software

VMware vSAN Health Error Nasıl Çözülür?

VMware vSAN Health Error Nasıl Çözülür?
VMware vSAN Health Error uyarısını; health kategorileri, vSAN Health servisi, disk, network, HCL, resync ve destek loglarıyla sistematik analiz eden rehber.
Yayın Tarihi
01 Haziran 2026
Güncellenme
01 Haziran 2026
Okuma Süresi
15 dk okuma
Yazar
LeonX Expert Team

VMware vSAN Health Error, vSAN cluster içinde kapasite, network, disk, HCL, object health, performans servisi veya vSAN Health servis katmanlarından birinde normal dışı durum olduğunu gösterir. Hata her zaman veri kaybı anlamına gelmez; ancak cluster'ın beklenen dayanıklılık, uyumluluk veya izlenebilirlik seviyesinden saptığını gösterdiği için sistematik ele alınmalıdır. Kısa cevap şudur: önce alarmın hangi vSAN Health kategorisinden geldiğini ayırın, sonra host, disk group, network, HCL, resync, object compliance ve vCenter tarafındaki vmware-vsan-health servis durumunu birlikte kontrol edin.

Bu rehber özellikle şu ekipler içindir:

  • VMware vSAN cluster yöneten sanallaştırma ekipleri
  • storage, network ve veri merkezi operasyon ekipleri
  • vSAN uyarılarını bakım penceresi öncesinde kapatmak isteyen sistem yöneticileri
  • HCL, firmware, disk ve network kaynaklı vSAN Health hatalarını ayırmak isteyen kurumlar

Hızlı Özet

  • Broadcom KB 326438, vSAN Health Service check'lerini capacity, cluster, data, hardware compatibility, network, physical disk ve proactive tests gibi çok sayıda kategoriye ayırır.
  • VMware vSAN Health Error tek bir hata değildir; önce kırmızı veya sarı olan test ailesi bulunmalıdır.
  • vSAN Health servisi başlamıyorsa veya GUI health bilgisini gösteremiyorsa sorun cluster'dan önce vCenter servis katmanında olabilir.
  • HCL, SCSI controller, firmware, driver ve physical NIC kontrolleri bakım veya vLCM remediation akışını durdurabilir.
  • Network health tarafında küçük ping, büyük ping, MTU, connectivity, partition ve latency testleri ayrı değerlendirilmelidir.
  • Güvenli müdahale, alarmı susturmak değil; doğrulama, log, resync etkisi ve bakım modu riskini aynı kayıt altında kapatmaktır.

İçindekiler

VMware vSAN Health Error için kurumsal depolama sistemi görseli

Görsel: Wikimedia Commons - IBM System Storage DCS3700, j_cadmus, CC BY 2.0. WebP formatına optimize edilmiştir.

vSAN Health Error Ne Anlama Gelir?

vSAN Health Error, vSAN'ın kendi sağlık testlerinden en az birinin beklenen sonucu üretmediğini anlatır. Bu uyarı bazen gerçek veri erişilebilirliği riski, bazen bakım öncesi uyumluluk problemi, bazen de health bilgisini toplayan servis katmanında hata anlamına gelebilir.

Broadcom KB 326438, vSAN Health Service check'lerini şu ana ailelerde toplar:

Health ailesiTipik hataİlk ayrım
Capacity Utilizationdüşük boş alan, limit yaklaşımıkapasite ve component sayısı
Clusterdisk format, config consistency, time synchostlar arası parite
Dataobject health, object formatpolicy ve erişilebilirlik
Hardware Compatibilitycontroller, firmware, disk, NICHCL ve driver uyumu
NetworkMTU, connectivity, partition, latencyVMkernel ve fiziksel ağ
Physical Diskdisk health, congestion, metadatacache/capacity device etkisi
Performance Servicestats collection, performance objectmetrik görünürlüğü

Bu nedenle VMware vSAN Cluster Degraded Sorunu daha çok cluster dayanıklılığına odaklanırken, bu yazı vSAN Health Error uyarısını kategori bazında ayırma ve güvenli müdahale akışına odaklanır.

İlk 10 Dakikada Hangi Kontroller Yapılmalı?

İlk müdahale, alarmı susturmak veya hostu hemen maintenance mode'a almak olmamalıdır. Güvenli başlangıç sırası:

  1. vSphere Client üzerinde Cluster > Monitor > vSAN > Skyline Health yolunda kırmızı veya sarı test adını kaydedin.
  2. Hatanın capacity, network, physical disk, hardware compatibility, data veya service katmanından geldiğini ayırın.
  3. Son 24 saat içinde vLCM remediation, firmware update, host reboot, disk değişimi, network değişikliği veya sertifika yenileme olup olmadığını kontrol edin.
  4. Resyncing components sayısını ve tahmini bitiş süresini inceleyin.
  5. Object compliance durumunu kritik VM'ler için ayrıca doğrulayın.
  6. vCenter tarafında vSAN Health servis durumu ve ilgili log dosyalarını kontrol edin.
  7. Tek host mu, tüm cluster mı, belirli disk group mu etkilendiğini ayırın.

Bu yaklaşım Donanım & Yazılım Hizmetleri altında yürütülen sanallaştırma ve depolama operasyonlarıyla doğrudan ilişkilidir. Özellikle Depolama Kapasite Planlama ve Performans Optimizasyonu vSAN health sinyallerini kapasite, performans ve bakım standardıyla birlikte ele alır.

vSAN Health Servisi Çalışıyor mu?

Bazı senaryolarda sorun vSAN veri katmanından değil, vCenter üzerindeki vSAN Health servisinden kaynaklanır. Broadcom KB 433327, vSAN Health servisinin farklı vCenter sürümlerinde neden başlamayabileceğini ve hangi log belirtilerinin ayırıcı olduğunu özetler.

Kontrol edilmesi gerekenler:

  • service-control --status vmware-vsan-health çıktısı
  • /var/log/vmware/vsan-health/ altındaki servis logları
  • vCenter upgrade veya certificate değişikliği geçmişi
  • envoy, vpxd-svcs, vpostgres ve vsanvcmgmtd loglarında hata izi
  • vSAN ekranlarının vSphere Client içinde tamamen kaybolup kaybolmadığı

Eğer Health servisi başlamıyorsa, cluster gerçekten sağlıksız olduğu için değil, health bilgisini toplayan servis çalışmadığı için hata görülebilir. Bu ayrım özellikle bakım penceresi öncesi önemlidir; yanlışlıkla host veya disk müdahalesi yapmak yerine önce servis katmanı netleştirilmelidir.

Disk, HCL ve Firmware Hataları Nasıl Ayrılır?

vSAN Health Error uyarılarının önemli bir bölümü donanım uyumluluğu veya fiziksel disk tarafında çıkar. Broadcom KB 404723, ESXi upgrade pre-check veya remediation adımının SCSI controller is VMware certified gibi vSAN health alert nedeniyle durabileceğini gösterir.

Disk ve HCL tarafında şu ayrım yapılmalıdır:

  • SCSI controller vSAN HCL içinde mi?
  • controller firmware ve driver sürümü desteklenen kombinasyonda mı?
  • cache device veya capacity device üzerinde SMART, wear, latency veya congestion belirtisi var mı?
  • disk group layout beklenen gibi mi?
  • storage controller üzerinde vSAN ve non-vSAN diskler birlikte mi kullanılıyor?
  • alert gerçekten doğrulandı mı, yoksa eski HCL verisi veya geçici health sonucu mu?

Broadcom'un ilgili KB'sindeki önemli operasyon dersi şudur: alert ancak uyumluluk pozitif doğrulandıktan sonra susturulmalıdır. Yani "Silence Alert" bir çözüm değil, kanıtlandıktan sonra kullanılan operasyon adımıdır.

Bu başlık VMware vSAN Disk Grupları Nasıl Çalışır?, VMware vSAN Architecture Deep Dive ve VMware Storage Policy Nedir? içerikleriyle birlikte okunmalıdır.

Network Health Error Nasıl İncelenir?

vSAN network hataları storage problemi gibi görünebilir; fakat kök neden VMkernel, MTU, VLAN, physical NIC, driver veya switch tarafında olabilir. Broadcom KB 326438, network health altında küçük ping, büyük ping, MTU check, connectivity, unexpected members, partition ve latency testlerini ayrı başlıklar olarak listeler.

Network tarafında hızlı ayrım:

  • tüm hostlarda vSAN enabled VMkernel adapter var mı?
  • vSAN VMkernel IP'leri doğru VLAN'da mı?
  • küçük ping çalışırken büyük ping veya MTU testi hata veriyor mu?
  • vSAN cluster partition uyarısı var mı?
  • fiziksel NIC link speed, error rate veya driver/firmware uyarısı var mı?
  • RDMA/RoCE kullanılan ortamlarda NIC sertifikasyonu doğru mu?

vSAN network sağlığı, Network İzleme ve Yönetimi ile de operasyonel olarak izlenmelidir. Storage alarmı gibi görünen birçok olay, aslında network packet loss, MTU farkı veya latency kaynaklı olabilir. İlgili arka plan için VMware Network Yapısı Nasıl Çalışır? ve VMware VLAN Konfigürasyonu Nasıl Yapılır? yazıları tamamlayıcıdır.

Resync ve Object Compliance Ne Zaman Kritikleşir?

vSAN Health Error ile birlikte resync veya object compliance uyarısı varsa, müdahale daha dikkatli planlanmalıdır. Çünkü bir hostu bakım moduna almak, disk değiştirmek veya network üzerinde ek değişiklik yapmak mevcut toparlanma sürecini ağırlaştırabilir.

Kritikleşme işaretleri:

  • resync kuyruğu uzun süredir azalmıyor
  • object compliance kritik VM'lerde bozuk
  • capacity free space düşük
  • birden fazla host veya disk group etkilenmiş
  • bakım modu Ensure Accessibility seçeneğiyle bile riskli görünüyor
  • performans grafikleri resync sırasında yüksek latency gösteriyor

Bu durumda hedef, alarmı hızlıca kapatmak değil, veri dayanıklılığını daha fazla zayıflatmadan toparlanma yolunu yönetmektir. VMware vSAN Performance Optimization Rehberi resync, network ve workload baskısını performans penceresiyle birlikte yorumlamak için yararlıdır.

Kalıcı Önleme Planı

1-7 gün: Görünürlük

  • vSAN Health kategori raporu çıkarılır.
  • Son 30 gün içindeki recurring health uyarıları gruplandırılır.
  • vCenter vmware-vsan-health servis logları ve ESXi host logları saklanır.
  • En kritik VM'ler için object compliance örneklemesi yapılır.

8-20 gün: Standartlaştırma

  • HCL, firmware, driver ve controller standardı güncellenir.
  • vSAN network VLAN, MTU, NIC teaming ve switch trunk standardı belgelenir.
  • Capacity threshold ve resync alarm eşiği operasyon ekibiyle netleştirilir.
  • Bakım modu prosedürüne health pre-check maddesi eklenir.

21-30 gün: Test ve kanıt

  • Proactive VM creation test ve network performance test sonuçları saklanır.
  • Bakım öncesi ve bakım sonrası vSAN Health çıktısı karşılaştırılır.
  • Tekrarlayan alarm için root cause ve aksiyon sahibi atanır.
  • Gerektiğinde Broadcom support bundle hazırlanır.

Broadcom KB 327035, vSAN support loglarının toplanması ve Broadcom VCF Support'a yüklenmesi için yol gösterir. Kritik olaylarda yalnız ekran görüntüsü değil, log seti ve zaman çizelgesi de hazırlanmalıdır.

İlgili İçerikler

Kontrol Listesi

  • Kırmızı veya sarı health testinin tam adı kaydedildi
  • Hata capacity, cluster, data, HCL, network, physical disk veya service kategorisine ayrıldı
  • vCenter vmware-vsan-health servis durumu kontrol edildi
  • Disk group, cache device ve capacity device sağlığı incelendi
  • HCL, firmware ve driver kombinasyonu doğrulandı
  • vSAN VMkernel, VLAN, MTU ve physical NIC durumu kontrol edildi
  • Resyncing components ve object compliance bilgisi incelendi
  • Bakım modu veya remediation öncesi health pre-check alındı
  • Alarm susturulduysa doğrulama kanıtı kaydedildi
  • Support bundle ve olay zaman çizelgesi hazırlandı

LeonX ile Sonraki Adım

VMware vSAN Health Error, tek bir alarm ekranı olarak değil; storage, network, firmware, policy ve vCenter servis katmanlarının ortak sağlık sinyali olarak ele alınmalıdır. LeonX, Donanım & Yazılım Hizmetleri kapsamında Depolama Kapasite Planlama ve Performans Optimizasyonu, NAS / SAN Depolama Kurulum ve Yapılandırma ve Kurumsal Sanallaştırma Platformları Satış ve Lisanslama ile vSAN health sinyallerini kalıcı operasyon standardına bağlar.

Network görünürlüğü için İş ve Yönetim Hizmetleri altındaki Network İzleme ve Yönetimi de tamamlayıcıdır. Mevcut vSAN cluster'ınızı değerlendirmek veya teklif almak için İletişim sayfasından ilerleyebilirsiniz.

İlgili sayfalar:

Sık Sorulan Sorular

VMware vSAN Health Error veri kaybı anlamına mı gelir?

Her zaman değil. Bazı health error'lar uyumluluk, servis, network veya HCL kaynaklıdır. Ancak object health veya resync ile birlikte görülüyorsa veri dayanıklılığı etkilenmiş olabilir.

vSAN Health alarmı susturulabilir mi?

Evet, ancak yalnız doğrulama yapıldıktan sonra. HCL veya firmware gibi uyarılarda alarmı susturmak kök nedeni çözmez; sadece doğrulanmış istisnayı görünür alarm listesinden çıkarır.

vSAN Health servisi çalışmıyorsa ne yapılmalı?

Önce vCenter üzerinde vmware-vsan-health servis durumu ve ilgili loglar kontrol edilmelidir. Servis başlamıyorsa cluster'a müdahale etmeden önce vCenter servis katmanı ayrıştırılmalıdır.

Network hatası storage problemi gibi görünebilir mi?

Evet. MTU farkı, packet loss, partition veya latency vSAN tarafında data veya cluster health hatasına dönüşebilir.

Bakım öncesi en kritik kontrol nedir?

Bakım öncesinde vSAN Health, resyncing components, object compliance, kapasite boşluğu ve host maintenance mode seçeneği birlikte kontrol edilmelidir.

Kaynaklar

İç Link Rotası

Bu konu için ilgili hizmet sayfalarına geçin

Bu yazıyı daha hızlı ticari niyete bağlamak için ana hizmet, ilgili alt hizmet ve teklif akışını aşağıdan takip edebilirsiniz.

Paylaş

Facebook
Twitter
LinkedIn

İlgili Yazılar

Benzer konular hakkında daha fazlasını keşfedin

Dell Server Fan Failure Hatası Nasıl Çözülür?
Hardware & Software
2026-06-02
15 dk okuma

Dell Server Fan Failure Hatası Nasıl Çözülür?

Dell Server Fan Failure hatasını; iDRAC FAN olay kodları, Lifecycle Log, fiziksel fan kontrolü, hava akışı, firmware ve OpenManage izleme akışıyla açıklayan rehber.

Devamını Oku
FortiGate Access Control ISO 27001 Uyumu
Hardware & Software
2026-05-25
15 dk okuma

FortiGate Access Control ISO 27001 Uyumu

FortiGate access control ISO 27001 uyumunu; firewall policy, yönetici profilleri, VPN kullanıcı grupları, SoA kanıtı, loglama ve periyodik erişim gözden geçirmesiyle açıklayan rehber.

Devamını Oku
Dell iDRAC Not Responding Sorunu Nasıl Çözülür?
Hardware & Software
2026-05-22
13 dk okuma

Dell iDRAC Not Responding Sorunu Nasıl Çözülür?

Dell iDRAC not responding sorunu için bağlantı teşhisi, ağ kontrolü, RACADM belirtileri, soft reset, firmware hijyeni ve kalıcı düzeltme adımlarını açıklayan rehber.

Devamını Oku

Bültene Abone Olun

En son içgörüler, trendler ve uzman tavsiyeleri doğrudan posta kutunuza gelsin. IT profesyonelleri topluluğumuza katilin.

Gizliliğinize saygı duyuyoruz. İstediğiniz zaman abonelikten çıkabilirsiniz.