HPE Alletra/Primera Storage Sistemlerinde Quorum Witness Sorunu ve Çözüm Yöntemleri

PE sorage altyapılarında yüksek erişilebilirlik sağlamak amacıyla kullanılan Peer Persistence mimarisi iki farklı depolama sistemi arasında kesintisiz veri erişimi ve otomatik failover imkânı sunar.

Bu mimarinin sağlıklı çalışabilmesi için kritik bileşenlerden biri Quorum Witness (QW) mekanizmasıdır.

HPE tarafından yapılan öngörüsel analiz sonucunda bazı durumlarda quorum servisinin çalışmadığı ve bu nedenle Automatic Transparent Failover (ATF) özelliğinin devreye girmediği tespit edilebilmektedir.

Bu makalede quorum servisinin çalışmaması durumunda oluşabilecek problemler ve çözüm adımları detaylı şekilde ele alınmıştır.

Quorum Witness Nedir?

Quorum Witness Peer Persistence yapılandırmasında iki depolama sistemi arasında karar mekanizmasını sağlayan bir bileşendir.

Olası bir kesinti durumunda hangi sistemin aktif kalacağına karar verilmesini sağlar.

Bu yapı sayesinde:

  • Depolama sistemleri arasında otomatik failover gerçekleşebilir.
  • Servis kesintileri minimum seviyeye indirilir.
  • Veri erişimi kesintisiz şekilde devam eder.

Ancak Quorum Witness servisi aktif değilse sistemler failover senaryolarında doğru karar veremez ve Automatic Transparent Failover (ATF) çalışmaz.

Tespit Edilen Sorun

HPE predictive analytics sistemi aşağıdaki durumu tespit etmiştir.

  • Quorum servisi başlatılmamış
  • Bu nedenle target alletrastrg3_PP_SA üzerinde otomatik failover mekanizması çalışmamaktadır

Sistem tarafından üretilen hata kodu Message Code: 0x0250016

Bu durum Quorum Witness istemcisinin çalışmadığını veya yapılandırmanın tamamlanmadığını gösterebilir.

Quorum Durumu Nasıl Kontrol Edilir?

Quorum istemcisinin durumunu kontrol etmek için aşağıdaki CLI komutu kullanılabilir;

showrcopy -qw

Daha detaylı olarak hedef sistem üzerindeki durum aşağıdaki komutla görüntülenebilir.

cli% showrcopy -qw target

Bu komut çıktısında özellikle Q-Status sütunu kontrol edilmelidir.

Quorum durumu ayrıca depolama sisteminin web arayüzünden de görüntülenebilir.

Replication Partners → Quorum Witness → Status

Olası Durumlar ve Çözüm Adımları

1. QW Client “Initializing” veya “Re-starting” Durumunda

Eğer Quorum Witness istemcisi Initializing veya Re-starting durumunda görünüyorsa, servis düzgün başlatılamamış olabilir.

Bu durumda yapılması gereken işlem:

  1. QW istemcisini durdurun.
  2. Ardından yeniden başlatın.

Quorum durdurulduğunda sistem durumu tekrar Initializing olarak sıfırlanır ve yaklaşık 30 saniye içinde Started durumuna geçmesi beklenir.

Eğer bu geçiş otomatik olarak gerçekleşmezse, bir sonraki çözüm adımı uygulanmalıdır.

2. QW Client Durumu 30 Saniye İçinde Değişmiyorsa

Bazı durumlarda QW istemcisi düzgün şekilde yeniden başlatılamayabilir. Bu durumda yapılması gereken işlem;

  • Her iki depolama sistemi üzerinde bulunan QW client yapılandırmasını kaldırmak
  • Ardından yeniden oluşturmak

Bu işlem quorum istemcisinin yeniden yapılandırılmasını sağlayarak iletişim problemlerini ortadan kaldırabilir.

3. Quorum Durumu “NA” Olarak Görünüyorsa

Eğer quorum durumu NA olarak görüntüleniyorsa, bu quorum yapılandırmasının yapılmadığını gösterir.

Peer Persistence ortamında depolama sistemlerinin Quorum Witness sunucusu ile iletişim kurabilmesi için;

  • Quorum Witness sunucusunun IP adresi her iki depolama sisteminin target tarafında tanımlı olmalıdır.

Çözüm adımları:

  1. Her depolama sistemi üzerinde yeni bir QW client oluşturun.
  2. Quorum durumunun stabil hale gelmesini bekleyin.
  3. Ardından QW istemcilerini başlatın.

4. Quorum “Not-started” Durumunda

Eğer quorum durumu Not-started olarak görünüyorsa, servis henüz başlatılmamıştır.

Bu durumda yapılması gereken işlem oldukça basittir:

  • Quorum servisini başlatmak

Quorum servisi başlatıldığında Peer Persistence ortamında Automatic Transparent Failover (ATF) tekrar aktif hale gelecektir.

HPE Peer Persistence mimarisinde Quorum Witness sistemler arası karar mekanizmasını sağlayan kritik bir bileşendir. Quorum servisinin çalışmaması durumunda otomatik failover mekanizması devre dışı kalabilir ve bu durum yüksek erişilebilirlik mimarisini olumsuz etkileyebilir.

Bu nedenle sistem yöneticilerinin düzenli olarak:

  • Quorum durumunu kontrol etmesi
  • QW istemci servisinin çalıştığından emin olması
  • Quorum Witness sunucusu ile iletişimin doğru şekilde kurulduğunu doğrulaması önemlidir.

Doğru yapılandırılmış ve aktif bir Quorum Witness servisi sayesinde, depolama altyapısında olası kesintiler sırasında kesintisiz hizmet ve otomatik failover mekanizması güvenli şekilde çalışmaya devam edecektir.