VMware ESXi 6.5 ve üzeri Sürümlerde QLogic FCoE modullerinin neden olduğu PSOD sorunun giderilmesi
  1. Anasayfa
  2. VMware ESXi

VMware ESXi 6.5 ve üzeri Sürümlerde QLogic FCoE modullerinin neden olduğu PSOD sorunun giderilmesi

Merhabalar, bu makalemde HPE DL 380 Gen 10 sunucular üzerinde kullanılmayan Qlogic FcOE modullerden kaynaklanan VMware PSOD hatasının giderilmesine değiniyor olacağım.

ESXi host üzerinde ara ara sunucularda PSOD yada ara ara APD (All Path Down) benzer, bir bağlantı sorunu ile kaşılaşılabilir.

PSOD durumunda aşağıdaki hata ile karşılaşılması;

Panic bora/vmkernel/main/dlmalloc.c:4908 - Corruption in DLMALLOC referencing details ql_fcoe_delayed_wq.

Yada VMware ESXi vmkernel loglarında aşağıdaki logları kontrol ederek bu hatanın kaynağını kolaylıkla doğrulayabilirsiniz.

2022-02-05T15:50:29.767Z cpu0:2098299)@BlueScreen: PANIC bora/vmkernel/main/dlmalloc.c:4933 - Usage error in dlmalloc
2022-02-05T15:50:29.777Z cpu0:2098299)Code start: 0x42002f400000 VMK uptime: 71:10:29:18.618
2022-02-05T15:50:29.795Z cpu0:2098299)0x45399e91bd70:[0x42002f4fa5b0]PanicvPanicInt@vmkernel#nover+0x2cc stack: 0x42002f4fa5b0
2022-02-05T15:50:29.812Z cpu0:2098299)0x45399e91be20:[0x42002f4faa9c]Panic_NoSave@vmkernel#nover+0x4d stack: 0x45399e91be80
2022-02-05T15:50:29.828Z cpu0:2098299)0x45399e91be80:[0x42002f541510]DLM_free@vmkernel#nover+0x22d stack: 0x4311ea0f5840
2022-02-05T15:50:29.844Z cpu0:2098299)0x45399e91bea0:[0x42002f53e865]Heap_Free@vmkernel#nover+0xba stack: 0x42002f77816a
2022-02-05T15:50:29.862Z cpu0:2098299)0x45399e91bef0:[0x42002f42b604]vmk_SpinlockDestroy@vmkernel#nover+0x49 stack: 0x4311e9e85000
2022-02-05T15:50:29.879Z cpu0:2098299)0x45399e91bf10:[0x42003071749c]DeleteFabric@(qfle3f)#<None>+0x21 stack: 0x4311e9e9d818
2022-02-05T15:50:29.898Z cpu0:2098299)0x45399e91bf40:[0x42003071765f]_ReleaseFabricReference@(qfle3f)#<None>+0x2c stack: 0x4311ea0f6000
2022-02-05T15:50:29.918Z cpu0:2098299)0x45399e91bf70:[0x420030722126]ql_fcoe_do_singlethread_work@(qfle3f)#<None>+0x83 stack: 0x4311ea0f6000
2022-02-05T15:50:29.935Z cpu0:2098299)0x45399e91bf90:[0x42002f519158]vmkWorldFunc@vmkernel#nover+0x49 stack: 0x42002f519154
2022-02-05T15:50:29.951Z cpu0:2098299)0x45399e91bfe0:[0x42002f781ead]CpuSched_StartWorld@vmkernel#nover+0x86 stack: 0x0
2022-02-05T15:50:29.967Z cpu0:2098299)0x45399e91c000:[0x42002f4c2c23]Debug_IsInitialized@vmkernel#nover+0xc stack: 0x0

Bu sorun sunucu üzerinde bağlantısı olmayan Qlogic FCoE kartlardan kaynaklanmaktadır.

QLogic qfle3f driver modülü VMware ESXi host’un PSOD (crash) olmasına sebep oluyor. FCoE kullanılmadığı durumlarda discover paketleri gönderildiğinden sorun oluşabilmektedir. Bu sorunu gidermek için VMware ESXi host için storage erişiminde FCoE kullanmıyorsunuz eğer sorunu tekrar yaşamamak için “qfle3f” modülünü disable etmenizi veya sorunun çözüldüğü ESXi 7.0 ile uyumlu ESXi 7.0 driver version 2.1.25.0’a yükseltebilirsiniz.

Eğer bu kartı kullanmıyorsanız devre dışı bırakmak için aşağıdaki komutu VMware ESXi sunucuya ssh bağlantısı ile bağlanınız ve bu komutu çalıştırınız.

esxcli system module set --enabled=false --module=qfle3f

Bu komut çalıştırıldıktan sonra yapılan değişikliğin geçerli olması için VMware ESXi işletim sistemini yeniden başlatınız.

VMware ESXi işletim sisteminiz açıldıktan sonra “Configuration” -> “Storage Adapter” adresinze gidiniz ve daha önceki Qlogic kartların bu listede yer almadığını kontrol ediniz.