HPE SimpliVity altyapılarında node kurulumu sırasında Deployment Manager tarafından yapılan adımlar son derece kritik bir işlem akışı içerir. Bu akış içerisinde özellikle VMware ESXi yapılandırma ve yeniden başlatma adımları ortamın stabil şekilde çalışabilmesi için önem taşır.
Ancak bazı durumlarda donanım bileşenlerinin yapılandırma sürecine müdahalesi nedeniyle dağıtım işlemi kesintiye uğrayabilir.
Bu makalemde FC HBA kartının neden olduğu “DPLY_WAIT_FOR_HYPERVISOR_TO_REBOOT” hata senaryosunu tüm ayrıntılarıyla ele alacağız.
Hata Senaryosunun Genel Görünümü
SimpliVity Deployment Manager node kurulumu sırasında toplam 43 adımdan oluşan otomatik bir işlem dizisi yürütür. Bu süreçte VMware ESXi işletim sisteminin kurulumu, yapılandırılması, ağ ayarlarının uygulanması ve OmniStack bileşenlerinin yüklenmesi adım adım gerçekleştirilir.
Bu makaleye konu olan hata dağıtımın 11. adımında (Step 11/43) gerçekleşmektedir:
“Step 11 of 43: Wait for the hypervisor to reboot”
Bu adımda Deployment Manager node’un ikinci kez yeniden başlamasını bekler. Ancak ESXi ayağa kalksa bile Deployment Manager node’u doğru şekilde algılayamaz ve zaman aşımına (timeout) düşer.
Bu durum çoğunlukla node üzerinde bulunan Fibre Channel HBA (FC HBA) kartının varlığından kaynaklanmaktadır.
Hata Mesajlarının Detaylı Analizi
Dağıtımın başarısız olmasıyla birlikte orchestrator.log dosyasında şu mesajlar görülür:
DeployStatus(status:Running, detail:DPLY_WAIT_FOR_HYPERVISOR_TO_REBOOT,
message:Step 11 of 43: Wait for the hypervisor to reboot)
ERR_DPLY_TIMEOUT_BOOTING_HYPERVISOR: Time out occurred while waiting for the Hypervisor to boot.
Detay hata nedeni:
Caused by: 2: No such file
at com.jcraft.jsch.ChannelSftp.lstat(...)
Bu ne anlama geliyor?
- Deployment Manager aracı VMware ESXi host’a SFTP üzerinden bağlanarak belirli durum dosyalarını kontrol eder.
- Ancak host yeniden başlarken FC HBA’nın etkilediği donanım enumerasyonu (PCI scan ve device mapping) süreyi uzatabilir veya VMware ESXi’in bazı sistem dosyalarının geç yüklenmesine neden olabilir.
- Sonuç olarak Deployment Manager “host yeniden başladı ve PID/servisler ayakta” kontrolünü doğru zamanda yapamaz.
Sorunun Ortaya Çıktığı Ortamlar
Bu hata aşağıdaki ortamlarda gözlemlenmiştir:
- Sunucu Platformu: Tüm HPE SimpliVity destekli HPE sunucu modelleri
- HPE OmniStack Yazılım Sürümü: 5.x.x
- Hypervisor: VMware ESXi (SimpliVity uyumlu sürümler)
Sorunun Temel Nedeni: FC HBA Kartının Etkisi
SimpliVity sistemleri genellikle dahili depolama ve OmniStack Accelerator kartı üzerinden çalışır. FC HBA normalde kullanılmaz veya sadece belirli senaryolarda gereklidir.
FC HBA kartı node üzerinde etkin olduğunda:
- PCI Device Enumeration ESXi boot sürecinde uzar
- Bazı hardware modülleri daha geç yüklenir
- ESXi beklenen zamanda SSH/SFTP servislerini tam olarak başlatamayabilir
- Deployment Manager node’un “hazır” olduğunu algılayamaz
- Zaman aşımı oluşur ve dağıtım kesilir
Çözüm: FC HBA Kartını Geçici Olarak Devre Dışı Bırakmak
Sorunun çözümü oldukça basittir: Node’u yeniden dağıtmadan önce FC HBA kartı BIOS üzerinden devre dışı bırakılmalıdır.
ÖNEMLİ NOT FC HBA tamamen çıkarılmamalıdır yalnızca BIOS üzerinden Disable edilmesi yeterlidir. SVT Kurulumu tamamlandıktan sonra tekrar etkinleştirilebilir.
Adım Adım Çözüm Rehberi
Node Üzerindeki FC HBA PCI Slotunu Not Alın
Dağıtım sonrası yeniden aktif etmek için PCI slot bilgisi gereklidir.
Node’u Yeniden Başlatın
Sunucu açılırken ekranda “F9 for System Utilities” uyarısını gördüğünüzde F9’a basın.
BIOS Menü Yolunu İzleyin
Şu yolu takip edin:
System Utilities
→ System Configuration
→ BIOS/Platform Configuration (RBSU)
→ PCI Devices - PCI Device Enable/Disable
FC HBA Kartını Devre Dışı Bırakın
Listeden FC HBA kartını bulun → Disable
Ayarları Kaydedin ve Node’u Yeniden Başlatın
SimpliVity Node Dağıtımını Tekrar Başlatın
Bu kez Step 11 sorunsuz geçilecek ve süreç normale dönecektir.
Dağıtım Tamamlanınca FC HBA’yı Yeniden Etkinleştirin
Aynı BIOS yolunu izleyerek kartı tekrar Enable edin.