OpenStack Punya Masakari, Apa Fungsinya?
Dalam dunia komputasi awan, ketersediaan tinggi (high availability / HA) bukan lagi sebuah kemewahan—melainkan sebuah kebutuhan. Ketika Anda menjalankan aplikasi penting di atas mesin virtual (VM), downtime bisa berarti kerugian finansial, reputasi yang tercoreng, bahkan kehilangan pelanggan. Di sinilah Masakari, layanan HA milik OpenStack, hadir sebagai solusi. Masakari dirancang untuk menangani dan memulihkan mesin virtual secara otomatis jika terjadi kegagalan, menjaga lingkungan cloud Anda tetap tangguh, otomatis, dan selalu aktif.
Artikel ini akan membahas apa itu Masakari, bagaimana cara kerjanya, serta mengapa layanan ini penting dalam implementasi OpenStack.
🚀 Apa Itu Masakari?
Masakari adalah sebuah proyek OpenStack yang menyediakan pemulihan otomatis untuk instance mesin virtual (VM) saat terjadi kegagalan. Nama "Masakari" berasal dari bahasa Jepang yang berarti “kapak perang”—melambangkan kemampuannya yang tegas dalam “memotong” kegagalan dengan cepat dan efisien.
Masakari berfokus pada HA di level instance, artinya Masakari tidak menangani seluruh infrastruktur atau host secara menyeluruh, melainkan menjaga agar VM tetap berjalan dengan baik. Jika sebuah instance mengalami kegagalan—baik karena host crash, proses layanan mati, atau VM itu sendiri berhenti merespons—Masakari akan secara otomatis melakukan pemulihan berdasarkan kebijakan yang telah ditentukan.
Layanan ini sangat berguna di lingkungan yang memiliki SLA (Service-Level Agreement) ketat atau layanan yang harus selalu aktif, seperti cloud untuk perusahaan, aplikasi finansial, e-commerce, atau jaringan telekomunikasi.
🧠 Bagaimana Cara Kerja Masakari?
Masakari bekerja sebagai serangkaian komponen monitoring dan pemulihan yang terus memantau infrastruktur OpenStack, khususnya layanan Nova (compute). Masakari memiliki arsitektur modular dan terintegrasi langsung dengan komponen inti OpenStack lainnya.
Ada tiga jenis kegagalan utama yang bisa ditangani oleh Masakari:
Host Failure Recovery
Terjadi ketika seluruh node komputasi (server fisik tempat VM berjalan) mengalami kegagalan. Masakari akan mendeteksi kejadian ini dan mencoba memindahkan semua instance yang terdampak ke host lain yang masih sehat.
Process Failure Recovery
Kegagalan terjadi bukan pada host, melainkan pada proses layanan penting, seperti Nova Compute. Masakari bisa mendeteksi kegagalan proses ini dan melakukan pemulihan terhadap instance yang terdampak.
Instance Failure Recovery
Kegagalan hanya terjadi pada instance tertentu, misalnya proses VM-nya crash atau tidak merespons. Masakari akan melakukan reboot atau migrasi instance berdasarkan kebijakan yang telah ditentukan.
🧩 Arsitektur dan Komponen Masakari
Masakari terdiri dari beberapa komponen utama yang saling bekerja sama:
🔹 Masakari API
Merupakan antarmuka REST API yang digunakan untuk menerima notifikasi kegagalan dari sistem monitoring eksternal (seperti Monasca atau skrip kustom) dan memulai proses pemulihan.
🔹 Masakari Engine
Merupakan “otak” dari Masakari. Engine ini menganalisis notifikasi kegagalan dan menjalankan tindakan pemulihan yang sesuai, seperti reboot VM atau migrasi ke host lain.
🔹 Masakari Monitors
Masakari tidak memiliki sistem monitoring bawaan, tapi mengandalkan integrasi dengan alat monitoring eksternal seperti:
-
Monasca – layanan monitoring OpenStack
-
Pacemaker/Corosync – untuk monitoring tingkat OS
-
Skrip kustom – bisa dikembangkan sesuai kebutuhan
Monitor inilah yang mendeteksi adanya kegagalan dan mengirimkan laporan ke Masakari API.
🔄 Alur Kerja Pemulihan
Berikut gambaran singkat proses kerja Masakari saat mendeteksi kegagalan:
-
Monitor eksternal (misalnya Monasca) mendeteksi adanya kegagalan pada host, proses, atau instance.
-
Notifikasi dikirim ke Masakari API.
-
Masakari Engine memproses notifikasi dan menentukan langkah pemulihan berdasarkan kebijakan yang ditentukan.
-
Masakari berinteraksi dengan Nova untuk:
-
Reboot instance
-
Melakukan evacuation (memindahkan instance ke host lain)
-
Melakukan live migration jika diperlukan
-
Masakari mencatat log dari setiap tindakan untuk keperluan audit dan analisis.
⚙️ Konfigurasi dan Kebijakan Pemulihan
Masakari mendukung kebijakan pemulihan yang fleksibel dan dapat disesuaikan, antara lain:
-
Evakuasi otomatis VM ke host lain jika host utama gagal
-
Reboot otomatis jika instance mati secara tidak terduga
-
Penundaan waktu sebelum pemulihan untuk menghindari false positive
-
Batas jumlah percobaan pemulihan sebelum instance dianggap gagal permanen
Anda juga bisa membuat daftar hitam (blacklist) untuk mencegah host atau instance tertentu ikut dalam proses pemulihan—misalnya untuk keperluan pemeliharaan.
🧪 Masakari vs Solusi HA Tradisional
Mengapa memilih Masakari dibandingkan solusi HA seperti Pacemaker atau VMware HA?
Keunggulan Masakari antara lain:
-
Terintegrasi langsung dengan OpenStack: Tidak perlu tambahan sistem eksternal
-
Berbasis API: Mudah diotomasi dan terintegrasi dengan pipeline DevOps
-
Skalabel: Cocok untuk cloud besar dengan ribuan VM
-
Berbasis kebijakan: Memberikan kontrol penuh pada administrator
Namun perlu dicatat bahwa Masakari tidak mencegah kegagalan—ia hanya merespons kegagalan dengan cepat. Juga, Masakari hanya menangani ketersediaan di level instance, bukan aplikasi atau database.
🔒 Aspek Keamanan
Karena Masakari memiliki kemampuan untuk menghidupkan ulang atau memindahkan VM, keamanan adalah hal penting:
-
Gunakan otentikasi via Keystone (layanan identitas OpenStack)
-
Amankan endpoint API Masakari
-
Terapkan Role-Based Access Control (RBAC) untuk membatasi siapa yang boleh menjalankan pemulihan
💡 Kapan Harus Menggunakan Masakari?
Berikut beberapa contoh penggunaan Masakari:
-
Cloud Telekomunikasi yang membutuhkan SLA tinggi dan layanan terus-menerus
-
Perbankan dan layanan keuangan yang tak bisa toleransi downtime
-
E-commerce yang tidak boleh berhenti beroperasi selama traffic tinggi
-
Private Cloud Enterprise yang ingin HA tanpa biaya lisensi vendor proprietary
🌐 Kesimpulan
Masakari adalah salah satu layanan penting dalam ekosistem OpenStack yang mungkin tidak banyak disorot, tapi punya peran besar dalam menjaga sistem cloud tetap berjalan lancar. Jika Anda mengelola cloud skala besar dan mengutamakan uptime, Masakari menawarkan otomatisasi dan kecerdasan untuk membantu cloud Anda menjadi self-healing.
Meskipun bukan pengganti disaster recovery atau HA di tingkat aplikasi, Masakari sangat efektif dalam menyediakan ketersediaan tingkat infrastruktur. Ini membuatnya sangat relevan bagi siapa pun yang ingin membangun lingkungan cloud yang tangguh dan andal.