Dell Server High Availability Design Guide hazırlarken en sık hata, yüksek erişilebilirliği yalnız iki sunucuyu yan yana koymak veya çift güç kaynağı eklemek gibi dar bir çerçevede düşünmektir. Sağlam bir HA mimarisi; güç, soğutma, hot-swap bileşenler, depolama yolu yedekliliği, cluster davranışı ve izleme katmanının birlikte tasarlanmasıyla kurulur. Kısa cevap şudur: Dell sunucu tarafında gerçek yüksek erişilebilirlik, tekil bileşen yedekliliğini operasyonel görünürlük ve failover tasarımıyla birleştirdiğinizde oluşur.
Bu rehber özellikle şu ekipler içindir:
- PowerEdge yatırımı yapan BT altyapı ekipleri
- kesinti riskini azaltmak isteyen veri merkezi yöneticileri
- cluster ve failover tasarımı yapan sistem mühendisleri
- yüksek erişilebilirlikli sunucu altyapısı kurmak isteyen kurumlar
Hızlı Özet
- Dell'in yüksek erişilebilir cluster mimarisi belgeleri, sunucuya ek olarak depolama yolu ve controller seviyesinde de redundancy gerektirdiğini açıkça gösterir.
- Dell rail/rack uyum matrisi, bakım erişimini ve cable management davranışını tasarımın parçası haline getirir; fiziksel servis erişimi de HA planının parçasıdır.
- Dell PowerEdge owner manual belgeleri, redundant PSU ve hot-swappable disk/fan yapılarının doğru model seçimiyle birlikte değerlendirilmesi gerektiğini ortaya koyar.
- OpenManage Enterprise Power Manager, güç kaynağı durumu ve thermal alert görünürlüğü sağlayarak HA tasarımını yalnız fiziksel değil ölçülebilir hale getirir.
- Yüksek erişilebilirlik için tek bir noktanın yedekli olması yetmez; güç, ağ, depolama ve yönetim düzlemi birlikte ele alınmalıdır.
İçindekiler
- Dell Sunucu Tarafında High Availability Ne Demektir?
- Fiziksel Katmanda Hangi Redundancy Kararları Gerekir?
- Cluster ve Depolama Tasarımı Nasıl Kurgulanmalı?
- İzleme ve Operasyon Katmanı Neden Tasarımın Parçasıdır?
- Kontrol Listesi
- Sık Sorulan Sorular

Görsel: Wikimedia Commons - Server Cable Management Arm (2).
Dell Sunucu Tarafında High Availability Ne Demektir?
High availability, yalnız sunucu arızasında servis ayağa kalksın anlamına gelmez. Dell'in cluster çözüm dokümanlarında açıkça vurgulanan yaklaşım şudur: veri erişimi hem planlı hem plansız kesintilerde korunmalı, bunun için de sunucu ile depolama arasındaki yol üzerinde tekil arıza noktaları azaltılmalıdır.
Bu çerçevede HA tasarımı şu katmanları kapsar:
- sunucu bileşen yedekliliği
- güç kaynağı ve PDU dağıtımı
- depolama controller ve path redundancy
- cluster failover mantığı
- bakım anında güvenli servis erişimi
- alarm, metrik ve olay görünürlüğü
Dolayısıyla “çift PSU var, o halde HA var” yaklaşımı eksiktir. Aynı servisin ayakta kalması için ağ, depolama ve yönetim katmanı da arıza toleranslı olmalıdır.
Fiziksel Katmanda Hangi Redundancy Kararları Gerekir?
1. Redundant PSU tek başına yeterli değildir
Dell PowerEdge R630 ve benzeri owner manual belgeleri, sistemlerin iki adet AC veya DC redundant PSU ile çalışabildiğini açıkça belirtir. Ancak bu faydanın anlamlı olması için:
- PSU'ların farklı besleme hattına bağlanması
- farklı PDU üstünden enerji alması
- rack içi kablolamanın bakım sırasında tek noktadan etkilenmemesi
gerekir.
2. Hot-swappable bileşenler operasyonel süreklilik sağlar
Dell owner manual ve spec sheet belgeleri hot-swappable disk, fan ve güç kaynağı kavramını yalnız donanım listesi olarak değil, servis kesintisini azaltan tasarım özelliği olarak gösterir. Hot-swap şu nedenle kritiktir:
- bakım penceresini kısaltır
- planlı değişimde tam shutdown ihtiyacını azaltır
- arıza etkisini daha dar bir pencereye sıkıştırır
3. Rail ve cable management da HA konusudur
Bu nokta çoğu tasarımda atlanır. Dell rail sizing ve rack compatibility matrix, fiziksel uyumsuzluk veya servis erişim zorluğunun operasyonel sürekliliği bozabileceğini dolaylı biçimde gösterir. Sunucuyu rack dışına kontrollü çekemediğiniz, CMA davranışını hesaba katmadığınız veya arka boşluk bırakmadığınız bir tasarım, arıza anında onarımı geciktirir.
Cluster ve Depolama Tasarımı Nasıl Kurgulanmalı?
Dell'in Building Highly Available Systems dokümanı, iki önemli dersi çok net verir:
- host tabanlı cluster tek başına yeterli değildir
- server-to-storage I/O path üzerindeki bileşenler de redundant düşünülmelidir
Giriş seviyesi ile tam redundant yapı arasındaki fark
Dell dokümanında üç yaklaşım anlatılır:
- tek yol içeren giriş seviyesi yapı
- dual-port HBA ile daha yedekli yapı
- birden fazla HBA ve çift yol içeren tam redundant yapı
Bu fark kritik çünkü:
- tek HBA arızası tüm storage erişimini etkileyebilir
- tek controller veya tek kablo arızası cluster değerini düşürür
- path failover şeffaf değilse uygulama kesintisi büyür
Tasarımda hangi sorular sorulmalı?
- node sayısı kaç olacak
- quorum veya witness mantığı nasıl kurgulanacak
- her node storage'a kaç ayrı path ile erişecek
- storage controller ve cache yapısı nasıl korunacak
- maintenance sırasında hangi node ayakta kalacak
Yüksek erişilebilirlikli sunucu tasarımında yalnız compute tarafına değil, storage path davranışına da aynı sertlikle bakılmalıdır.
İlgili İçerikler
- Dell Server Datacenter Design Guide
- Dell Server Firmware Update Failed Sorunu
- Dell PowerEdge Audit Log ISO 27001 Uyumu
İzleme ve Operasyon Katmanı Neden Tasarımın Parçasıdır?
Yüksek erişilebilirlik, yalnız failover olduğunda değil; failover riski önceden görülebildiğinde olgunlaşır. Dell OpenManage Enterprise Power Manager metrik ekranları, güç kaynağı durumu, thermal alert state ve benzeri bileşen görünürlüğünü sunar. Bu yaklaşım önemlidir çünkü:
- PSU bozulmadan önce dengesizlik sinyali görülebilir
- termal baskı artışı izlenebilir
- rack yoğunluğu ile kapasite ilişkisi görünür hale gelir
HA tasarımında şu gözlemler zorunlu olmalıdır:
- güç tüketimi trendi
- thermal uyarılar
- arızalı veya degraded bileşenler
- bakım sonrası durum doğrulaması
Bir mimari yalnız yedekli değil, izlenebilir olduğunda gerçekten işletilebilir hale gelir.
Kontrol Listesi
- Çift PSU farklı PDU ve farklı besleme hattına dağıtıldı
- Hot-swap disk, fan ve PSU tasarımı model seçiminde doğrulandı
- Rail/CMA uyumu ve servis erişim boşluğu hesaplandı
- Cluster node sayısı ve failover mantığı belirlendi
- Storage path redundancy seviyesi netleştirildi
- Tekil HBA, controller ve kablo arızası senaryoları test edildi
- OpenManage veya eşdeğer izleme katmanı devreye alındı
- Bakım sırasında hizmet sürekliliği prosedürü yazılı hale getirildi
LeonX ile Sonraki Adım
Dell server high availability design, yalnız donanım özelliklerini toplamak değil; arıza anında hizmetin nasıl davranacağını önceden tasarlamaktır. LeonX, PowerEdge altyapılarında redundant güç, cluster mimarisi, storage path planı ve operasyonel izleme modelini birlikte ele alarak daha dayanıklı ve daha ölçülebilir bir HA standardı kurmanıza yardımcı olur.
İlgili sayfalar:
- Hardware & Software Hizmetleri
- Yüksek Erişilebilirlikli Sunucu Altyapı Çözümleri
- Sunucu Kurulum, Konfigürasyon ve Devreye Alma
- İletişim
Sık Sorulan Sorular
Çift PSU kullanmak yüksek erişilebilirlik için yeterli mi?
Hayır. İki PSU aynı PDU veya aynı enerji hattına bağlıysa tek hata noktası devam eder.
Hot-swappable fan ve disk neden bu kadar önemlidir?
Çünkü arıza sonrası bakımın sistem kapatılmadan yapılabilmesini sağlar ve kesinti süresini azaltır.
Cluster varsa storage path redundancy yine gerekli midir?
Evet. Cluster node ayakta kalsa bile storage erişimi tek yoldan geçiyorsa gerçek süreklilik zayıflar.
Cable management arm neden HA tasarımında anılıyor?
Çünkü bakım anında cihazın güvenli çekilip müdahale edilebilmesi, arıza süresini ve operasyonel riski etkiler.
İzleme katmanı olmadan HA kurulmuş sayılır mı?
Kısmen. Yedekli olabilir ama öngörülebilir ve yönetilebilir olmaz; bu da pratikte olgun HA seviyesi değildir.
Kaynaklar
- Dell Enterprise Systems Rail Sizing and Rack Compatibility Matrix
- Building Highly Available Systems: Dell PowerEdge Cluster SE600W and PowerVault MD3000
- Dell PowerEdge R630 Owner's Manual
- Dell PowerEdge R420 Owner's Manual - Installing a Redundant Power Supply
- OpenManage Enterprise Power Manager - View Metrics and Monitor Devices and Groups History
- Wikimedia Commons - Server Cable Management Arm (2)



