VMware vSphere ortamlarında High Availability (HA) özelliği kritik bir görevi üstlenir herhangi bir host (ESXi sunucu) arızalandığında sanal makineleri otomatik olarak başka bir host üzerinde çalıştırarak kesintiyi en aza indirmek.
Ancak bazı durumlarda HA gerçekte host çalışır durumda olmasına rağmen şu uyarıyı verebilir:
A possible host failure has been detected on <host> in cluster <cluster> in <datacenter> datacenter
Bu uyarı ilk bakışta ciddi bir arıza izlenimi verse de çoğunlukla sebep ağ düzeyinde IP çakışmasıdır.
vSphere Client üzerinde:
- Host’un özet ekranında “A possible host failure” uyarısı çıkar.
- Cluster içindeki bazı sanal makineler geçici olarak taşınamaz veya yanıt vermeyebilir.
Log dosyalarında:
AAM Logları (/var/log/vmware/aam/vmware_<hostname>.log
)
MESSAGE: Message received from an unexpected sender: msgid 621 from (1/0:rtcp_1.0)
HA ajanı beklenmedik bir kaynaktan mesaj alıyor.
VMkernel Logları (/var/log/vmkernel.log
)
arp: xx:xx:xx:xx:xx:xx is using my IP address <esxi_ip>!
Duplicate IP <esxi_ip> detected at mac xx:xx:xx:xx:xx:xx
ESXi host’un IP adresi başka bir cihaz tarafından da kullanılıyor.
VOBD Logları (/var/run/log/vobd.log
)
[vob.net.vmknic.ip.duplicate] A duplicate IP address was detected for <esxi_ip> on interface vmk0
Çakışan IP ve MAC adresi burada açıkça görüntülenebilir.
vCenter Logları (/var/log/vmware/vpxd.log
)
Failed to SSL handshake; certificate verify failed
Host name does not match the subject name(s) in certificate
IP çakışması vCenter ile host arasındaki güvenli bağlantıyı (SSL handshake) de bozabilir.
Bu hata genellikle ESXi host’un yönetim IP adresi ağda başka bir cihaz tarafından da kullanıldığında ortaya çıkar.
Örneğin:
- Yanlış yapılandırılmış bir ağ cihazı (switch, router, storage, management board).
- DHCP’nin yanlış çalışması sonucu bir IP adresinin iki farklı cihaza atanması.
- Manuel atanan IP’lerde yapılan bir hata.
Sonuç olarak:
- HA ajanı hatalı paketler alır.
- vCenter, host ile iletişim kurarken hata alır.
- HA mekanizması, host’u “arızalı” gibi algılar.
Geçici Çözüm
- vSphere Client üzerinden host’a sağ tıklayıp Reconfigure for vSphere HA seçeneğini çalıştırmak sorunu geçici olarak düzeltir.
- Ancak asıl sebep çözülmezse, hata yeniden ortaya çıkar.
Kalıcı Çözüm
1. Çakışan IP’yi Tespit Et
/var/log/vobd.log
içindeki loglarda hangi MAC adresinin aynı IP’yi kullandığını görebilirsiniz.- Ağ yöneticiniz bu MAC adresini kullanarak çakışan cihazı kolayca bulabilir.
2. Ağdaki IP Çakışmasını Gider
- ESXi host’un IP’sini değiştirmek yerine, genellikle diğer cihazın IP’si yeniden yapılandırılır.
- IP planlaması gözden geçirilmelidir.
3. HA Yapılandırmasını Yenile
- Sorun çözüldükten sonra cluster veya host üzerinde HA yeniden yapılandırması yapılmalıdır:
- vSphere Client → Cluster/Host → Reconfigure for vSphere HA