VMware vSphere altyapılarında Content Library sanal makinelerin (VM) merkezi olarak saklanması, şablonların yönetilmesi ve hızlı bir şekilde deploy edilmesi için oldukça kullanışlı bir özelliktir.
Özellikle büyük ve dağıtık yapılarda subscribed content library sayesinde merkezi bir kütüphane üzerinden farklı vCenter veya ESXi host’lara sanal makine deploy etmek mümkün hale gelir.
Ancak bazı senaryolarda içerik kütüphanesi üzerinden VM deploy işlemleri sırasında timeout (zaman aşımı) sorunları yaşanabilir.
Bu makalemde VMware vSphere 7.0 ortamında görülen bu problemin belirtilerini nedenlerini, çözüm yöntemlerini ve geçici çözümleri detaylıca ele alacağız.
Content Library’den VM deploy etmeye çalıştığınızda aşağıdaki belirtilerle karşılaşabilirsiniz:
- VM import işlemi başarısız olur ve işlem otomatik olarak geri alınır.
- vCenter loglarında (
/var/log/vmware/vpxd/vpxd.log) şu tip mesajlar görülür:
[YYYY-MM-DDTHH:MM:SS] info vpxd[52879] Removing VM [...] due to failed import
[YYYY-MM-DDTHH:MM:SS] error vpxd[62818] Caught exception while importing VM: vim.fault.Timedout
- Content Library log dosyasında (
/var/log/vmware/content-library/cls.log) network copy hataları raporlanır:
Error during transfer of ds:///vmfs/volumes/vsan.../vm-123.vmdk:
Could not complete network copy for file .../contentlib-xxxx/vm-123.vmdk
(vim.fault.NetworkCopyFault)
Bu log çıktıları VM imaj dosyalarının (özellikle .vmdk) hedef datastore’a kopyalanamadığını ve işlem zaman aşımına uğradığını gösterir.
Sorunun Nedeni
vSphere 7.0 ortamında bu sorun genellikle şu sebeplerden kaynaklanır:
- Zaman Aşımı Limiti
- vCenter Server’daki
vpxdservisi içerik kütüphanesinden yapılan transferlerin 30 dakikadan uzun sürmesi durumunda işlemi otomatik olarak sonlandırır.
- vCenter Server’daki
- Ağ Üzerinde Gecikmeler
- Özellikle VSAN veya NFS datastore kullanılan ortamlarda network gecikmeleri kopyalama süresini uzatabilir.
- Büyük Ölçekli Deploy İşlemleri
- Aynı anda birçok VM deploy edildiğinde transfer işlemleri kuyruğa alınır ve bu da toplam süreyi artırarak zaman aşımı riskini yükseltir.
- Büyük Tekil VM İmajları
- Çok büyük boyutlu bir VM imajının kopyalanması zaman aşımı limitini aşabilir.
Sonuç olarak kütüphanedeki VM dosyaları hedef datastore’a ulaşmadan işlem başarısız olur.
VMware bu sorunu vCenter Server 7.0 Update 3f (Build 20051473) sürümünde kalıcı olarak çözmüştür.
Dolayısıyla en güvenli ve önerilen çözüm VMware vCenter ortamınızı bu sürüme yükseltmektir. Güncel sürümle birlikte Content Library’den yapılan VM deploy işlemleri zaman aşımı olmadan daha stabil şekilde tamamlanır.
Geçici Çözüm (Workaround)
Eğer ortamınızı güncelleyemiyorsanız şu geçici çözümü uygulayabilirsiniz:
Content Library Ayarlarını Değiştirin
- Varsayılan yapılandırma: “Download content only when needed”
Bu durumda VM deploy sırasında gerekli dosyalar publisher kütüphaneden çekilir. - Önerilen değişiklik: “Download all contents immediately”
Bu seçenek aktif edildiğinde tüm içerikler önceden hedef ortama indirilir. Böylece deploy sırasında ağ kopyalama yapılmaz ve zaman aşımı sorunu ortadan kalkar.
Büyük Ölçekli İşlemleri Planlayın
- Çok sayıda VM deploy edilecekse işlemleri küçük gruplar halinde gerçekleştirin.
- Böylece ağ trafiği ve kopyalama yükü dengelenmiş olur.
Network ve Datastore Performansını İzleyin
- Ağ trafiği dar boğazları, latency sorunları veya yavaş çalışan datastore’lar bu hatayı tetikleyebilir.
- Bu nedenle ilgili altyapı bileşenlerini kontrol etmek de faydalı olacaktır.
Content Library VMware vSphere ortamlarında merkezi yönetim ve hızlı dağıtım için oldukça güçlü bir araçtır. Ancak özellikle büyük ölçekli ortamlarda ve büyük boyutlu VM deploy işlemlerinde vSphere 7.0’da timeout sorunları yaşanabilmektedir.
- Kalıcı çözüm: vCenter Server 7.0 Update 3f sürümüne yükseltmek.
- Geçici çözüm: Content Library’yi “download all contents immediately” moduna almak.
Bu adımlar sanal makine dağıtımlarınızı daha kararlı hale getirecek ve kesintisiz bir iş sürekliliği sağlayacaktır.