1. Anasayfa
  2. HPE

HPK3 Firmware Güncellemesi Sonrası HPE NVMe E3.S SSD Arızaları


Hewlett-Packard Enterprise (HPE) tarafından yayımlanan Customer Advisory (Document ID: a00156336en_us) belirli NVMe E3.S SSD modellerinin HPK2 → HPK3 firmware güncellemesi sonrasında kritik arızalara yol açabildiğini bildirmektedir.

Doküman High (Yüksek) öneme sahiptir ve özellikle Gen11 / Gen12 platformlarda ciddi operasyonel riskler doğurur.

Bu advisory’e göre HPK3 firmware’i yüklendikten sonra bazı diskler kullanılamaz (Read Only) duruma geçmekte sistem tarafından Failed/Critical olarak işaretlenmekte ve üretim ortamlarında ani servis kesintilerine sebep olabilmektedir.

Sorunun Teknik Tanımı

HPK3 firmware güncellemesi uygulandıktan sonra etkilenen NVMe SSD’lerde aşağıdaki semptomlar gözlemlenmektedir:

  • Disk ön LED’i sabit amber (turuncu) yanar
  • HPE iLO arayüzünde (Storage sekmesi) disk durumu Critical / Failed olarak görünür
  • Disk Read Only (salt okunur) moda geçer, veri yazılamaz
  • IML (Integrated Management Log) kayıtlarında NVMe disk hatası oluşur
  • SMART / SmartCTL çıktısında disk sağlığı FAILED olarak raporlanır

Örnek SmartCTL çıktısı:

SMART overall-health self-assessment test result: FAILED!
NVM subsystem reliability has been degraded
media has been placed in read only mode

Bu durum disk donanımsal olarak erişilebilir görünse bile üzerine veri yazılamadığı için RAID, VMware datastore veya işletim sistemi disklerinde kritik veri kaybı riskine yol açar.

Etkilenen Disk Modelleri (Scope)

Aşağıdaki HPE NVMe E3.S SSD modelleri ve option kit’ler bu soruna açıktır:

KapasiteModel TipiKullanım Profili
3.84 TBPS1010Read Intensive (RI)
7.68 TBPS1010Read Intensive (RI)
15.36 TBPS1010Read Intensive (RI)
3.2 TBPS1030Mixed Use (MU)
6.4 TBPS1030Mixed Use (MU)
12.8 TBPS1030Mixed Use (MU)

Ortak nokta: E3.S form faktörü + HPK3 firmware

Etkilenen Donanım Platformları

Bu firmware problemi, başta aşağıdaki platformlar olmak üzere geniş bir ürün ailesini etkilemektedir:

  • HPE ProLiant Gen11 Sunucular (DL360, DL380, DL365, DL385, ML350 vb.)
  • HPE ProLiant Gen12 Sunucular
  • HPE Synergy 480 Compute Module (Gen11 & Gen12)
  • HPE Alletra Storage Server 4110 / 4120

İşletim sistemi bağımsızdır (OS Independent); yani Linux, VMware ESXi veya Windows Server fark etmeksizin disk firmware seviyesinde problem oluşmaktadır.

Operasyonel ve İş Sürekliliği Riskleri

Bu sorunun üretim ortamlarında doğurabileceği riskler:

  • Datastore veya sistem diskinin aniden Read Only moda geçmesi
  • RAID bozulmaları ve disk rebuild başarısızlıkları
  • VMware ortamlarında VM’lerin pause veya crash olması
  • Backup/restore süreçlerinde disk yazma hataları
  • Planlanmamış bakım ve disk değişimi nedeniyle downtime

Özellikle kritik veritabanı, VDI ve yedekleme hedef diskleri üzerinde kullanıldığında risk seviyesi yüksektir.

HPE’nin Resmî Çözüm ve Tavsiyeleri (Resolution)

Önleyici Aksiyon (En Önemlisi)

HPE açıkça şunu önermektedir:

HPK3 firmware güncellemesini uygulamayın.
Düzeltme içeren gelecek firmware sürümü beklenmelidir.

Firmware Güncellendiyse ve Sorun Oluştuysa:

Seçenek 1 – Disk Kurtarma (Linux):
Disk kullanılabilir hale getirilebiliyorsa aşağıdaki komut uygulanabilir:

nvme format /dev/nvmeXnY

Bu işlem disk üzerindeki tüm verileri siler.

Seçenek 2 – Disk Değişimi:
Eğer formatlama mümkün değilse veya disk stabil çalışmıyorsa, disk değişimi gereklidir.

Seçenek 3 – HPE Support:
Yerel HPE destek hattı veya HPE Support Center üzerinden vaka açılmalıdır.
Referans: Support Communication Cross Reference ID: SIK11001

En İyi Uygulamalar ve Tavsiyeler

  • SSP / firmware güncellemeleri üretim öncesi test ortamında mutlaka doğrulanmalı
  • NVMe disk firmware’leri için vendor advisory takibi yapılmalı
  • Kritik sistemlerde immutable backup + offline kopya bulundurulmalı
  • Firmware upgrade öncesi tam yedek alınmalı
  • iLO ve IML log’ları düzenli izlenmeli

HPK3 firmware sorunu, tek başına bir “disk firmware bug”’ı olmanın ötesinde, kurumsal veri merkezlerinde ciddi iş sürekliliği riskleri yaratabilecek seviyededir. HPE’nin de net olarak belirttiği gibi, HPK3 firmware uygulanmamalı, etkilenen sistemlerde dikkatli aksiyon planı oluşturulmalıdır.

Bu advisory, özellikle Gen11 / Gen12 HPE platformlarında NVMe E3.S SSD kullanan tüm kurumlar için yüksek öncelikli olarak değerlendirilmelidir.