VMware HA (High Availability), host arızası olduğunda sanal makinelerin başka hostlarda yeniden ayağa kaldırılmasını sağlayan süreklilik katmanıdır. Özellikle üretim iş yüklerinde "tek host bağımlılığı" riskini düşürmek için en temel vSphere mekanizmalarından biridir.
Kısa cevap: vSphere HA, ESXi hostlarını bir cluster içinde izler; host arızası tespit edildiğinde etkilenen VM'leri alternatif hostlarda otomatik restart ederek hizmet sürekliliğini korur.
Kısa Özet
- TechDocs'a göre vSphere HA, VM'leri ve hostları bir cluster havuzunda izler; host arızasında VM'ler başka hostlarda yeniden başlatılır.
- HA cluster kurulduğunda bir host primary olarak seçilir, primary host diğer hostları ve korunan VM'leri izler.
- Primary host, arıza tipini anlamak için network + datastore heartbeating birlikte kullanır.
- HA admission control, failover için yeterli kaynağı rezerve eder; 3 temel yaklaşım sunar:
- Cluster resource percentage
- Slot policy
- Dedicated failover hosts
- Dokümandaki notlara göre admission control kullanımı için cluster'da en az 3 host gerekir.
- VM Monitoring, VMware Tools heartbeat'i gelmezse VM'i restart eder; I/O kontrolünde varsayılan pencere 120 saniyedir (
das.iostatsinterval). - Datastore heartbeating tarafında host başına varsayılan heartbeat datastore sayısı 2, maksimum değer 5 (
das.heartbeatdsperhost).
İçindekiler
- VMware HA Nedir?
- vSphere HA Nasıl Çalışır?
- Admission Control Neden Kritik?
- VM ve Uygulama İzleme
- Datastore Heartbeating Detayları
- vSphere HA ile vCenter HA Farkı
- Operasyonel Kontrol Listesi
- Sık Sorulan Sorular

Görsel: Wikimedia Commons - NOIRLab HQ Server Racks (6V6A0402-CC), CC BY 4.0.
VMware HA Nedir?
VMware HA, host seviyesindeki kesintilere karşı VM'leri koruyan bir cluster özelliğidir. Tek bir hosta bağlı çalışan servisler yerine, cluster içindeki alternatif hostlarda otomatik toparlanma hedeflenir.
Bu yaklaşım özellikle plan dışı host arızalarında operasyon ekibine zaman kazandırır ve manuel müdahale ihtiyacını azaltır.
vSphere HA Nasıl Çalışır?
TechDocs akışında temel mekanizma şöyledir:
- Cluster içinden bir host primary rolünü alır.
- Primary host, secondary hostları ve korunan VM'leri izler.
- Olası host sorunlarında primary host, network ve datastore heartbeating sinyallerinden arıza tipini ayırır.
- Gerçek host arızası doğrulandığında etkilenen VM'ler alternatif hostlarda restart edilir.
Bu modelde kritik nokta yalnız "restart" değil, doğru arıza sınıflandırmasıdır (host failure, network partition, isolation gibi).
Admission Control Neden Kritik?
Admission control olmadan HA teknik olarak açık olsa bile, arıza anında yeterli boş kaynak kalmaması mümkündür. Bu yüzden HA, failover için önceden kaynak rezervi mantığıyla çalışır.
vSphere HA failover kapasitesini üç modelle yönetir:
- Cluster resource percentage
- Slot policy
- Dedicated failover hosts
Pratikte çoğu kurumsal ortamda ilk yaklaşım (resource percentage) daha esnek yönetilir; ancak karar cluster topolojisine göre verilmelidir.
VM ve Uygulama İzleme
HA yalnız host arızasına değil, VM içi "yanıt vermeme" durumlarına da cevap verebilir:
- VM Monitoring: VMware Tools heartbeat + I/O aktivitelerine bakar.
- Application Monitoring: uygulama heartbeat'leri üzerinden izleme yapar.
Dokümana göre heartbeat gelmezse I/O penceresi kontrol edilir; son 120 saniye içinde disk/ağ aktivitesi yoksa reset kararı uygulanabilir. Bu süre das.iostatsinterval ile değiştirilebilir.
Datastore Heartbeating Detayları
Primary host, yönetim ağı üzerinden bir secondary hosta erişemediğinde datastore heartbeating ile hostun gerçekten düştüğünü mü, partition/isolation mı yaşadığını ayırt eder.
Önemli teknik notlar:
- vCenter Server heartbeat datastore setini erişim yaygınlığına göre seçer.
das.heartbeatdsperhostvarsayılanı 2, üst sınırı 5..vSphere-HAdizini heartbeat ve koruma metadatası için kullanılır; silinmemelidir.- vSAN datastore, heartbeat datastore olarak kullanılamaz (paylaşımlı alternatif yol gerekir).
vSphere HA ile vCenter HA Farkı
Bu iki kavram sık karıştırılır:
- vSphere HA: VM iş yüklerini host arızasına karşı korur.
- vCenter HA: vCenter Server'ın kendisini host/hardware arızasına karşı aktif-pasif mimariyle korur.
Kısacası biri "workload continuity", diğeri "control-plane continuity" odaklıdır.
Operasyonel Kontrol Listesi
- Admission control politikası cluster kapasitesine göre yazılı hale getirildi.
- Host isolation response ve VM restart priority ayarları gözden geçirildi.
- VM Monitoring sensitivity profili iş yüklerine göre ayrıştırıldı.
- Heartbeat datastore seçimi ve bağımlı depolama yolları doğrulandı.
- Arıza senaryosu testleri (host down / network partition) planlı olarak tatbik edildi.
Sık Sorulan Sorular
HA, vMotion yerine geçer mi?
Hayır. vMotion planlı canlı taşıma mekanizmasıdır; HA ise arıza sonrası toparlanma mekanizmasıdır. Birlikte kullanıldıklarında gerçek operasyonel fayda oluşur.
Admission control kapatılabilir mi?
Geçici olarak kapatılabilir; ancak kalıcı kapatmak, arıza anında restart garantisini zayıflatır.
HA için minimum kaç host önerilir?
TechDocs notunda admission control için en az 3 host gereksinimi belirtilir. Üretim sürekliliği için 3+ host yaklaşımı daha güvenlidir.
Ankara'daki çok lokasyonlu ekipler için en kritik adım nedir?
Cluster kapasite planını ve restart önceliklerini runbook'a bağlamak. Böylece saha ekipleri aynı arıza tipine aynı yanıtı verebilir.
Sonuç
VMware HA, doğru tasarlanmadığında "açık ama etkisiz" kalabilen; doğru yönetildiğinde ise kesinti riskini somut biçimde düşüren bir katmandır. Admission control, monitoring ve heartbeating ayarlarını birlikte ele almak, sürdürülebilir HA başarısının anahtarıdır.
Kurumunuza özel HA mimarisi için bizimle iletişime geçebilirsiniz.
Kaynaklar
- Broadcom TechDocs - vSphere Availability
- Broadcom TechDocs - Creating and Using vSphere HA Clusters
- Broadcom TechDocs - How vSphere HA Works
- Broadcom TechDocs - vSphere HA Admission Control
- Broadcom TechDocs - VM and Application Monitoring
- Broadcom TechDocs - Datastore Heartbeating
- Broadcom TechDocs - vCenter High Availability
- Wikimedia Commons - NOIRLab HQ Server Racks (6V6A0402-CC)



