1. Anasayfa
  2. VMware ESXi

VMware vSphere FDM (Fault Domain Manager) Agent Nedir?


VMware ortamında High Availability (HA) özelliğini aktifleştirdiğinde perde arkasında çalışan işin tüm yükünü omuzlayan bir yazılım bileşeni vardır: FDM Agent. vCenter Server’da vSphere HA’yı etkinleştirdiğin anda cluster’daki her bir ESXi host üzerine otomatik olarak FDM agent kurulur. İşte bu küçük ama güçlü ajan HA’nın “beyni ve kası”dır.

FDM Agent’ın misyonunu şöyle özetleyebiliriz. Cluster’daki tüm hostların ve VM’lerin sağlık durumunu izle, bir problem olduğunda saniyeler içinde tepki ver ve sanal makineleri güvenli şekilde yeniden çalıştır. Yani HA senaryolarında komut veren kişi vCenter’dır ama asıl işi yapan sahadaki askerler FDM ajanlarıdır. Kısacası FDM vSphere HA’nın yürütme motorudur.

FDM Agent’ın Temel Görevleri

1. Host ve VM Sağlık Kontrolü (Heartbeat Yönetimi)

  • FDM, her hostun management network üzerinden diğer hostlara düzenli aralıklarla “heartbeat” (canlılık sinyali) göndermesini sağlar.
  • Ayrıca datastore heartbeat mekanizmasıyla, sadece ağ değil storage erişimi üzerinden de canlılık doğrulanır.
  • Böylece yanlış “host down” algıları (false positive) büyük ölçüde önlenir.

2. Master ve Slave Rolleri

  • HA cluster’ında bir host Master, diğer hostlar Slave olarak atanır.
  • Master FDM Agent:
    • Tüm cluster’ın sağlık durumunu izler.
    • Hangi hostta hangi VM’in çalıştığını bilir.
    • Bir host arızalanırsa failover sürecini planlar.
  • Slave FDM Agent:
    • Kendi hostunun ve üzerindeki VM’lerin sağlık raporunu master’a iletir.
    • Master’dan gelen talimatları (örneğin “VM’yi yeniden başlat”) uygular.

Eğer master host arızalanırsa, diğer FDM ajanları yeni bir master seçimi süreci başlatır. Bu seçim tamamen otomatik gerçekleşir.

3. Failover Sürecini Yönetmek

  • Bir host düştüğünde, FDM master:
    1. O hosttaki VM’leri belirler.
    2. Admission Control ile hangi hostlarda yeterli kaynak olduğunu kontrol eder.
    3. Slave ajanlara talimat gönderir: “Şu VM’i sen aç, şu VM’i diğer host açsın.”
    4. VM’ler kısa bir kesintiden sonra yeni hostlarda çalışmaya başlar.

4. vCenter ile İletişim Köprüsü

  • vCenter, HA yapılandırmasını ve yönetimini sağlar ama failover operasyonlarını bizzat kendisi yapmaz.
  • Bu operasyonları sahada uygulayan, adım adım işleten ajan FDM’dir.
  • Yani:
    • vCenter = beyin/komutan
    • FDM Agent = uygulayıcı askerler

FDM Agent’ın Logları ve İzleme

HA ile ilgili sorunları anlamak için en kritik log:

  • /var/log/fdm.log (her ESXi host üzerinde bulunur).

Bu logda şunlar görülür:

  • Master seçim süreçleri,
  • Host heartbeat mesajları,
  • VM failover kararları,
  • İzolasyon algılamaları,
  • Datastore heartbeat sonuçları.

HA troubleshooting yaparken bu log en güvenilir kaynaktır.

FDM Agent ile İlgili Yaygın Sorunlar

  1. FDM Agent yüklenememiş → Çözüm: vSphere Client’ten “Reconfigure for vSphere HA” seçeneğiyle cluster yeniden yapılandırılır.
  2. Ağ kesintisi → Host yanlışlıkla “down” görünebilir. Çözüm: datastore heartbeat + ek izolasyon adresleri (das.isolationAddress).
  3. Datastore sorunları → VM’lerin failover sırasında yanlış yerde çalışmasına sebep olabilir.

FDM Agent’ın Gelişmiş Fonksiyonları

  • VM Monitoring: VM’in iç OS seviyesinde canlılık kontrolünü yapar. Eğer VMware Tools heartbeat yoksa VM resetlenebilir.
  • Isolation Response: Host izole olduğunda (networkten kopsa bile VM’ler çalışıyor olabilir), FDM host üzerindeki VM’lere ne yapılacağını belirler:
    • Power Off → VM başka hostta yeniden başlatılır.
    • Shutdown → Yumuşak kapatma.
    • None → Hiçbir şey yapma.
  • Datastore Heartbeat Seçimi: Tüm hostların erişebildiği en az 2 datastore seçilir. Bu seçim de FDM tarafından yapılır.

Master Seçim Süreci (Election Process)

Bir cluster’da HA aktifleştirildiğinde:

  1. Tüm hostlara FDM agent yüklenir.
  2. Hostlar arasında bir “seçim” yapılır.
  3. En uygun host Master olur (kriterler: erişilebilir datastore, envanter bilgisi, UUID vb.).
  4. Diğer hostlar slave olarak çalışır.

Eğer master düşerse, seçim süreci yeniden başlar. Bu sayede cluster’da her zaman bir lider (master) bulunur.