1. Anasayfa
  2. VMware ESXi

VMware Proactive HA


Klasik VMware HA’yı hatırlayalım. Bir ESXi host tamamen düştüğünde, üzerindeki sanal makineler (VM) diğer hostlarda yeniden başlatılır. Bu iş sürekliliği için harika bir mekanizmadır; ancak küçük de olsa downtime vardır. Ama donanım arızaları çoğu zaman ani çöküşle değil küçük uyarılarla başlar.

  • PSU (güç kaynağı) hata sinyalleri,
  • DIMM (RAM modülü) hata sayısının artması,
  • Fan arızaları,
  • RAID kartında predictive failure (ön görülen arıza),
  • Anakart veya işlemci sıcaklığının kritik seviyelere yaklaşması.

Eğer bu uyarılar önceden yakalanırsa host tamamen düşmeden önce aksiyon alınabilir. İşte Proactive HA bu mantıkla geliştirilmiş önleyici (proaktif) iş sürekliliği mekanizmasıdır.

Proactive HA Nasıl Çalışır?

  1. Donanım Sağlık Bilgilerinin Toplanması
    • ESXi host üreticinin health provider eklentisi (Dell iDRAC, HP iLO, Cisco UCS Manager vb.) üzerinden sürekli izlenir.
    • Bu eklenti donanım bileşenlerinin (fan, PSU, RAM, disk, sıcaklık vb.) sağlık durumunu vCenter’a raporlar.
  2. Bozulma Algılama (Degraded State)
    • Donanımda bir arıza sinyali geldiğinde host “Degraded / Riskli” olarak işaretlenir.
  3. Politika Uygulama
    • Proactive HA, cluster yöneticisinin tanımladığı policy’ye göre aksiyon alır:
      • Quarantine Mode
      • Maintenance Mode
  4. DRS ile Entegrasyon
    • DRS (Distributed Resource Scheduler), Proactive HA ile birlikte çalışır.
    • Riskli host üzerindeki VM’leri kesintisiz vMotion ile sağlıklı hostlara taşır.
    • Bu taşıma sırasında downtime sıfırdır.
  5. Riskli Hostun İzolasyonu
    • VM’ler taşındıktan sonra host cluster’da yeni iş yükleri için kullanılmaz.
    • Donanım arızası büyürse host tamamen kapatılabilir ya da bakım için ayrılabilir.

Proactive HA Policy Seçenekleri

1. Quarantine Mode (Karantina Modu)

  • Host “riskli” durumdadır.
  • DRS, mümkünse tüm VM’leri başka hostlara taşır.
  • Eğer cluster kapasitesi sınırlıysa bazı VM’ler bu hostta kalabilir.
  • Yeni VM atamaları bu hosta yapılmaz.

Kullanım: Daha hafif uyarılarda (örneğin tek bir fan arızası).

2. Maintenance Mode (Bakım Modu)

  • Host tamamen boşaltılır.
  • Tüm VM’ler vMotion ile diğer hostlara taşınır.
  • Host üzerinde hiçbir VM bırakılmaz.

Kullanım: Kritik donanım uyarılarında (örneğin PSU failure, yüksek sıcaklık, çoklu bileşen arızası).

Proactive HA ve Klasik HA Farkı

ÖzellikVMware HA (Klasik)Proactive HA
Çalışma zamanıHost tamamen düştükten sonraHost düşmeden önce (erken uyarı)
VM taşınma yöntemiYeniden başlatma (downtime var)vMotion (downtime yok)
KaynakHost heartbeat kaybıDonanım sağlık sinyalleri
AmaçKaybolan hostu telafi etmekSorun büyümeden hostu boşaltmak

Kısacası: VMware HA reaktiftir Proactive HA ise proaktiftir.

Senaryo: 8 hostlu bir cluster

  • Host-4’ün PSU’su bozulmaya başlıyor.
  • HP iLO bu hatayı Proactive HA’ya bildiriyor.

Quarantine Mode seçiliyse:

  • Host-4 “riskli” işaretlenir.
  • DRS yeterli kaynak varsa VM’leri diğer hostlara taşır.
  • Eğer kaynak kısıtlıysa bazı VM’ler Host-4 üzerinde çalışmaya devam edebilir.

Maintenance Mode seçiliyse:

  • Host-4 üzerindeki tüm VM’ler canlı olarak (vMotion ile) taşınır.
  • Host-4 tamamen boşaltılır ve cluster’ın dışında bırakılır.

Sonuç: Host düşmeden önce VM’ler sıfır kesintiyle güvenli hostlara taşınmış olur.

Proactive HA’nın Katkıları

  • Kesintisiz iş sürekliliği: VM’ler canlı olarak taşındığı için kullanıcı hiçbir kesinti yaşamaz.
  • Donanım arızalarına erken tepki: PSU, fan, RAM, disk gibi bileşenler bozulmadan host izole edilir.
  • DRS entegrasyonu: Yükler dengeli dağıtılır, kaynak israfı olmaz.
  • Esnek politika seçimi: Hafif risklerde Quarantine, kritik risklerde Maintenance kullanılabilir.
  • Planlanmamış downtime’ı önleme: Sistem bozulmadan önce ortam güvenceye alınır.

  • Proactive HA, VMware’in donanım arızalarına karşı geliştirdiği önleyici koruma mekanizmasıdır.
  • Donanım sağlayıcılardan gelen sağlık bilgilerini kullanır.
  • Host düşmeden önce VM’ler güvenli hostlara kesintisiz vMotion ile taşınır.
  • İki politika sunar:
    • Quarantine Mode → Riskli host kullanılmaz ama kapasite darsa VM barındırmaya devam edebilir.
    • Maintenance Mode → Host tamamen boşaltılır.
  • Avantajı: Downtime olmadan donanım kaynaklı kesintileri önlemek.

Basitçe: VMware HA host düştükten sonra kurtarır, Proactive HA host düşmeden önce önlem alır.

İlginizi Çekebilir