HPE SimpliVity’de 2 node + 1 Arbiter mimarisinde tek bir node’u kapatmak yalnızca bir “sunucu kapatma” işinden ibaret değildir veri servislerinin tertemiz kapanması, quorum’un korunması ve geri dönüşte hızlıca “Healthy” duruma kavuşmak için dikkatle tasarlanmış bir akış gerektirir.
Bu makalemde production ortamda minimal etkilenme ile çalışabilmen için ön kontrol listesinden başlayıp OVC’nin usule uygun kapatılması, ESXi host’un maintenance ve power-off süreci ardından güvenli açılış ve sağlık doğrulamalarına uzanan uçtan uca bir yol haritası sunar.
OVC: Her host üzerinde çalışan SimpliVity veri servislerinin “beyni”dir. Kapatma sırasında önce OVC’nin kontrollü (graceful) kapatılması şarttır aksi halde depolama/metadata servisleri kirli kapanabilir. HPE arayüzünde All HPE SimpliVity Actions → Shut Down Virtual Controller ile yapılır.
Arbiter: 2 node ve stretched küme senaryolarında bağlayıcı oy (tie-breaker) sağlayarak split-brain riskini önler 2 node mimaride zorunludur. Windows servisi olarak (ve yeni sürümlerde belirli varyantlarda Linux) küme dışı bir yerde koşturulması önerilir. Kapatma sırasında erişilebilir olmalıdır.
Bu Operasyonun Altın Kuralı ve Sırası
- OVC’yi usule uygun (graceful) kapat
- ESXi host’u Maintenance Mode’a al
- ESXi host’u kapat (power off)
Bu sıra HPE’nin hem UI hem de CLI dokümanlarında açıkça yer alır. UI tarafında tek bir OVC’yi kapatmak için Shut Down Virtual Controller birden fazla OVC için gerekirse Force Virtual Controller Shut Down adımları bulunur.
Not (CLI davranışı): svt-shutdown-safe komutu OVC’yi güvenli kapatırken host’u da kapatabilir (sürüm ve durumlara bağlı). Kapatma akışını adım adım elle yönetmek istiyorsanız önce UI’den OVC’yi kapatıp ardından host’u bakım moduna alıp manuel kapatma yapmanız daha öngörülebilirdir.
“Pre-Flight” Check-list (Kapatma Öncesi)
Ağ & Arbiter
- Arbiter sunucusuna OVC/host’lardan erişim var mı? Ping/DNS ve firewall portları sağlıklı mı? Arbiter Mevcut Cluster dışı bir yerde mi? (SVT 2-node’da şarttır.)
Küme Sağlığı
- OVC’de oturum açın federasyonu kontrol edin:
# OVC shell (svtcli veya vCenter kimlik bilgileri) svt-session-start svt-federation-show(Federasyondaki host/OVC, datastore ve durum özetini görürsünüz.)
Single-Replica (Önerilir)
- Tek kopya VM’leri tespit edin:
svt-vm-show --single-replica(Varsa önce replikayı dengelemek/taşımak daha güvenlidir.)
VM Taşıma & IO Penceresi
- Kapatılacak host’taki tüm VM’leri vMotion/DRS ile diğer node’a alın.
- Devam eden yedekleme/IO işleri yok (veya tolere edilebilir) olmalı. UPS/PCNS senaryolarında da önce OVC’nin düzgün kapatılması gerekir.
Adım Adım Kapatma (2 Node + 1 Arbiter, Yalnızca 1 Node)
OVC’yi “Graceful” Kapatın
UI Yöntemi (Önerilen & Basit):
vCenter → ilgili host → All HPE SimpliVity Actions → Shut Down Virtual Controller → onaylayın. Bu adımda OVC’nin yönettiği servisleri temiz kapatır.
CLI Yöntemi (İleri Seviye):
OVC’ye SSH/Console:
# Yetkili oturum başlatın
svt-session-start
# Güvenli kapatma akışını başlatır
svt-shutdown-safe
# İlerlemeyi izleyin (HA/compliance beklemeleri vb.)
svt-shutdown-status
# (Takılırsa ve nedeni giderilemiyorsa) son çare:
svt-shutdown-force
svt-shutdown-safe: OVC’yi güvenli kapatır bazı sürümlerde host’u da kapatabilir. Planınızı buna göre yapın.svt-shutdown-status: “shutdown task yok / in progress / VM’ler bekleniyor” gibi net durumlar verir.svt-shutdown-force: HA beklemelerini atlar; yalnız mecbur kalırsanız.
İpucu: svt-shutdown-status uzun süre HA compliance bekliyorsa tipik nedenler aktif IO tek kopya objeler veya replikasyon beklemesi. Önce sebebi giderin “force”u acele etmeyin.
5.2 ESXi Host’u Maintenance Mode’a Alın
OVC kapandıktan sonra ESXi kabuğunda:
esxcli system maintenanceMode set --enable true
esxcli system maintenanceMode get
(Host üzerinde çalışan VM kalmamalı DRS/vMotion ile yük transfer edilmiş olmalı.)
5.3 ESXi Host’u Kapayın (Power Off)
esxcli system shutdown poweroff -r "Planned maintenance - 2-node SimpliVity cluster (1 node shutdown)"
Alternatif: iLO üzerinden kapatma. (UI belgelerinde OVC kapandıktan sonra maintenance ve power-off önerilir.)
Yeniden Açılış (Power On) ve Doğrulamalar
- Power On: iLO veya fiziksel düğme ile host’u açın.
- OVC Başlangıcı: Genellikle otomatik açılır açılmazsa vCenter’dan “Power On” verin.
- Maintenance’tan Çıkış için;
esxcli system maintenanceMode set --enable false - Sağlık Kontrolleri:
svt-session-start svt-federation-show svt-vm-show --single-replica(Federasyon “Healthy” tek kopya uyarısı yoksa süreç tamam.)
Sorun Giderme (Troubleshooting)
OVC Kapanmıyor / “HA compliance bekleniyor”
svt-vm-show --single-replicaile tek kopya var mı bakın replikayı dengeleyin. IO yoğun işleri bitirin. Gerekirse bekleyin son çaresvt-shutdown-force.
Arbiter Erişilemiyor
- 2 node için zorunlu. Erişim yoksa kapatmaya başlamayın önce Arbiter’ı onarın/taşıyın. (Windows hizmeti; ağdan erişilebilir ve failure domain dışında konumlandırılmalı.)
OVC “Zombie/Stuck” veya UI’den Emir Almıyor
- CLI’den durum bakın:
svt-shutdown-status. Pendingsizse yenidensvt-shutdown-safetetikleyin. (Saha deneyimlerinde raporlanmış bir yol.)
PCNS/UPS Otomatik Kapatma
- Senaryo kurgusunda da sıra OVC → Host olmalıdır. OVC’ye SSH ile
svt-shutdown-safetetikleyen script yaklaşımı yaygındır.
Otomasyon: Güvenli Kapatma İçin Örnek Komut Dizisi
Amaç: OVC’yi kapat, bekle, host’u maintenance ve power-off yap.
Uyarı: svt-shutdown-safe bazı sürümlerde host’u da kapatabilir bu durumda host adımlarını atlayın. Test ederek devreye alın.
#!/bin/bash
set -euo pipefail
OVC_IP="10.0.0.50"
HOST_REASON="Planned maintenance - 2-node SimpliVity (1 node)"
ssh -o StrictHostKeyChecking=no svtcli@"$OVC_IP" <<'OVC'
svt-session-start
svt-shutdown-safe
# 10 sn'de bir kontrol: shutdown görevi bitene kadar bekle
for i in {1..120}; do
OUT=$(svt-shutdown-status || true)
echo "$OUT"
if echo "$OUT" | grep -qi "not running"; then
break
fi
sleep 10
done
OVC
# OVC kapandıysa; bazı sürümlerde host da kapanmış olabilir.
# Host ayaktaysa düzenli akışa devam:
esxcli system maintenanceMode set --enable true
esxcli system maintenanceMode get
esxcli system shutdown poweroff -r "$HOST_REASON"
“Go/No-Go” Kontrol Noktaları
- Go: Arbiter erişilebilir federasyon sağlıklı (
svt-federation-showok), tek kopya riskleri yönetildi (--single-replicaboş veya planlandı), VM’ler taşındı IO/backup penceresi uygun. - No-Go: Arbiter erişilemiyor OVC kapanışı HA beklemelerinde kilitli ve nedeni giderilmedi, host üzerinde kritik VM var/taşınamıyor.