1. Anasayfa
  2. VMware ESXi

VMware HA – Failures and Responses (Hata Olursa Ne Olacak?)


VMware HA yalnızca “host düştü → VM yeniden başlatıldı” gibi basit bir mekanizma değildir. HA hata anında hangi aksiyonların alınacağını hangi sırayla alınacağını ve hangi VM’lerin öncelikli olduğunu tanımlamanıza izin verir. İşte bu politikaların bütününe Failures and Responses denir.

Bu ayarların amacı: Bir arıza gerçekleştiğinde sanal makinelerin plansız ve rastgele değil kontrollü ve iş sürekliliğini koruyacak şekilde ayağa kalkmasını sağlamaktır.

1. Host Monitoring

  • Tanım: Host Monitoring, HA’nın cluster’daki ESXi hostların sağlık durumunu izleyip izlemediğini belirler.
  • Çalışma prensibi:
    • Hostlar birbirine heartbeat sinyali gönderir.
    • Belirli süre boyunca sinyal alınamazsa, host “down” kabul edilir.
    • Bu durumda üzerindeki VM’lerin diğer hostlarda yeniden başlatılması süreci tetiklenir.
  • Kapalıysa ne olur?
    • HA host arızalarını görür, ama hiçbir VM yeniden başlatılmaz.
    • Yani failover mekanizması devre dışı kalır.

Genel kullanım:

  • Normalde daima açık bırakılır.
  • Ancak planlı bakım sırasında, gereksiz failover olmaması için geçici olarak kapatılabilir.

2. VM Restart Priority

  • Tanım: Hangi VM’in arıza sonrası önce hangisinin sonra açılacağını belirleyen ayardır.
  • Seçenekler:
    • Highest → En kritik VM’ler (ör. veritabanı, domain controller).
    • High → Önemli uygulama katmanı (ör. application server).
    • Medium (varsayılan) → Standart VM’ler.
    • Low → Önemsiz/test amaçlı VM’ler.
    • Disabled → Hiç restart edilmez.

Bu sayede failover sırasında önemli iş servisleri önce, destekleyici veya önemsiz VM’ler en sona bırakılır.

3. Orchestrated Restart (Bağımlı ve Sıralı Açılış)

Her ortamda tüm VM’lerin aynı anda açılması doğru değildir. Örneğin:

  1. Database (DB) önce açılmalı.
  2. Sonra Application Server (Uygulama katmanı).
  3. En son Web Server.

Bunu sağlamak için Orchestrated Restart kullanılır:

  • VM’ler gruplara ayrılır.
  • Bir grup tamamen açılmadan diğer grup başlamaz.
  • Ayrıca gruplar arasında gecikme süreleri (delay) tanımlanabilir.

Örnek:

  • DB’nin açılması 3 dakika sürüyorsa, App grubuna “DB açıldıktan 3 dk sonra başlat” kuralı yazılır.
  • Böylece App, veritabanı hazır olmadan açılmaya çalışmaz.

Bu mekanizma sayesinde HA, uygulama mimarilerini mantıksal sıraya uygun şekilde yeniden ayağa kaldırır.

4. VM Overrides (Özel VM Ayarları)

Cluster genelinde geçerli kurallar vardır, ama bazı VM’ler için istisnalar gerekebilir. İşte VM Overrides bunun için kullanılır.

  • Her VM’e özel ayrı kurallar yazılabilir:
    • Bir test VM’i için “Restart Disabled” seçilebilir.
    • Kritik bir monitoring VM’i için “Highest Priority” atanabilir.
  • Böylece cluster genelindeki ayarlardan bağımsız, tek tek VM seviyesinde hassas kontrol sağlanır.

Kullanım senaryosu:

  • İzleme yazılımları (Zabbix, vROps) → İlk açılanlar arasında olmalı.
  • Test/QA VM’leri → Hiç restart edilmesin.

Örnek Failover Senaryosu

Diyelim ki 1 host aniden çöktü. HA şu adımları uygular:

  1. Host Monitoring → Host’tan heartbeat gelmedi, host “down” kabul edildi.
  2. VM Restart Priority → Önceliğe göre VM’ler sıraya dizildi:
    • Önce Highest → Database
    • Sonra High → Application Server
    • En son Medium/Low → Web ve test VM’leri
  3. Orchestrated Restart → DB tamamen açılmadan App başlamadı, App hazır olmadan Web açılmadı.
  4. VM Overrides → Test VM’i hiç açılmadı, Monitoring VM’i Highest öncelikle ilk açılanlar arasında yer aldı.

Sonuç: Kritik sistemler önce, bağımlılıklar korunarak, önemsiz sistemler en sona bırakılarak düzenli bir failover gerçekleşti.

  • Host Monitoring: Host arızalarını izler, genellikle açık bırakılır.
  • VM Restart Priority: VM’lere önem sırasına göre restart önceliği tanımlar.
  • Orchestrated Restart: VM’lerin birbirine bağımlılıklarını gözeterek sırayla ve gecikmeyle açılmasını sağlar.
  • VM Overrides: İstisna tanımlayarak, tek tek VM seviyesinde özel kurallar yazmanıza olanak verir.

Böylece VMware HA, sadece “VM’leri yeniden başlatmak” değil doğru VM’i, doğru sırayla, doğru öncelikle başlatmak gibi ince ayarlı bir iş sürekliliği yönetimi sağlar.

İlginizi Çekebilir
NTP Stratum