[TR] VMware Aria Operations Cluster Yapısında Bir Node’un Manuel Olarak Kaldırılması

[TR] VMware Aria Operations Cluster Yapısında Bir Node’un Manuel Olarak Kaldırılması

VMware Aria Operations (eski adıyla vRealize Operations) büyük ve dağıtık ortamlarda performans, kapasite ve sağlık izleme süreçlerini yöneten kritik bir platformdur. Bu yapının temelinde ise “cluster” mimarisi bulunur.

Ancak bazı durumlarda cluster yapısındaki node’lar (düğümler) düzgün şekilde kaldırılamaz ve sistemde “ghost / erişilemeyen” node’lar olarak kalabilir.

Bu makalemde bu tür durumlarda node’un manuel olarak nasıl kaldırılacağını, dikkat edilmesi gereken noktaları ve olası riskleri detaylı ve anlaşılır bir şekilde ele alıyoruz.

Sorunun Tanımı

Aşağıdaki senaryolar VMware Aria Operations ortamlarında sıkça karşılaşılan problemlerdendir:

  • Cluster Management ekranında aynı node’un duplicate (çift) görünmesi
  • Bir node’un kapatılıp silinmesine rağmen cluster’dan kaldırılmaması
  • Node’un “inaccessible” (erişilemez) durumda görünmesi
  • UI üzerinden node kaldırma işleminin başarısız olması
  • Aria Operations arayüzüne erişilememesi

Bu gibi durumlarda, standart yöntemlerle node kaldırmak mümkün olmayabilir ve manuel müdahale gerekir.

Ortam Bilgisi

Bu çözüm aşağıdaki sürümler için geçerlidir:

  • VMware Aria Operations 8.0
  • VMware Aria Operations 8.1

Çözüm Yöntemleri

Manuel node kaldırma işlemi, cluster içerisindeki herhangi bir node üzerinden root yetkisi ile çalıştırılan API çağrıları ile gerçekleştirilir.

Data veya Remote Collector Node Kaldırma

Eğer kaldırılacak node bir Data Node veya Remote Collector ise aşağıdaki komut kullanılır;

curl -ik -u 'admin:password' -X DELETE https://PRIMARY_NODE_IP/casa/deployment/slice/NODE_TO_REMOVE_IP

Parametre Açıklamaları:

  • admin:password → Admin kullanıcı bilgileri
  • PRIMARY_NODE_IP → Primary node IP adresi
  • NODE_TO_REMOVE_IP → Kaldırılacak node’un IP adresi

Primary veya Replica Node Kaldırma

Primary veya Replica node kaldırmak daha kritik bir işlemdir ve ek bir parametre gerektirir;

curl -ik -u 'admin:password' -X DELETE https://PRIMARY_NODE_IP/casa/deployment/slice/NODE_TO_REMOVE_IP/REPLACEMENT_NODE_IP

Önemli Notlar:

  • HA (High Availability) aktif olmalıdır, aksi halde işlem başarısız olur
  • Büyük cluster’larda veri yeniden dağıtımı (rebalancing) uzun sürebilir

Parametre Açıklamaları:

  • REPLACEMENT_NODE_IP → Kaldırılan node’un yerine geçecek node IP adresi

İşlem Sonrası Yapılması Gerekenler

Manuel müdahale sonrasında aşağıdaki adımlar önerilir:

  • Tüm cluster node’larını yeniden başlatmak (reboot) gerekebilir
  • Cluster durumunu kontrol etmek için:
    • Cluster Management ekranı
    • Log kayıtları
  • Veri yeniden dağıtımı sürecini (rebalancing) izlemek

Dikkat Edilmesi Gerekenler (Kritik Uyarılar)

Bu işlem, doğrudan cluster yapısını etkilediği için dikkatli uygulanmalıdır:

Cluster Durumu

İşlem yalnızca şu durumlarda yapılmalıdır;

  • Cluster Online veya Offline (clean state) durumdaysa

Şu durumlarda KESİNLİKLE yapılmamalıdır:

  • Cluster failed (hatalı) durumdaysa
  • Cluster scale (genişleme/küçülme) sürecindeyse

Bu gibi durumlarda mutlaka VMware Support ile iletişime geçilmelidir.

Yedekleme ve Snapshot

İşleme başlamadan önce:

  • Cluster’ın geçerli bir snapshot’ı alınmalı
  • Alternatif olarak backup bulunmalıdır

Bu, olası veri kayıplarına karşı kritik öneme sahiptir.

Manuel node kaldırma işlemi aşağıdaki riskleri barındırır:

  • Veri kaybı (özellikle yanlış node hedeflenirse)
  • Cluster dengesinin bozulması
  • Performans düşüşü (rebalancing sürecinde)
  • Servis kesintileri

Bu nedenle işlemler mutlaka planlı ve kontrollü şekilde yapılmalıdır.

VMware Aria Operations cluster yapısında node yönetimi kritik bir konudur. Normal şartlarda node ekleme ve çıkarma işlemleri UI üzerinden sorunsuz şekilde yapılmalıdır. Ancak bazı istisnai durumlarda manuel müdahale kaçınılmaz hale gelir.

Bu makalede ele aldığımız yöntemler, özellikle UI erişiminin olmadığı veya node’un “yetim” (orphaned) durumda kaldığı senaryolarda hayat kurtarıcıdır. Bununla birlikte, bu işlemlerin doğrudan sistemin çekirdeğine müdahale ettiği unutulmamalı ve gerekli tüm önlemler alınarak uygulanmalıdır.