なぜ大規模システム向け「マネージドモニタリング for Zabbix」なのか― IIJだからできる!エンタープライズ向け総合ソリューション

2020年10月01日 木曜日


【この記事を書いた人】
福原 亮

サポートセンター勤務、システム監視運用設計担当を経てIIJ統合運用管理サービス(UOM)を始めとする、アウトソーシングサービスの企画/開発に従事。

「なぜ大規模システム向け「マネージドモニタリング for Zabbix」なのか― IIJだからできる!エンタープライズ向け総合ソリューション」のイメージ

IIJの福原です。
サポートセンターの24-365勤務、システム監視運用設計担当を経て、IIJ統合運用管理サービスの企画/開発に従事しています。

今回は「IIJ統合運用管理サービス(UOM) マネージドモニタリング for Zabbix」の開発背景をご紹介します。

時代に合った、新しい運用ソリューションの必要性

IIJ統合運用管理サービス(以下、UOM)」は「PATROLCLARICE(パトロールクラリス、通称パトクラ)」を使ったSaaS型の監視サービスを提供しています。PATROLCLARICEは、現場のプロフェッショナルエンジニアが求める細かな項目や設定に幅広く対応し、Amazon CloudWatchやAzure Monitorにも対応するなど、非常に優秀な監視ツールです。

ただ、従量課金制という仕組み上、大規模システムにおいては、お客さまに十分なパフォーマンスを提供できていないケースもあります。

システム規模が巨大になり、1,000台を超える大規模システムの監視を考えなければならない新しい時代には、新しいソリューションが求められます。

大規模システムならではの監視という設計思想が不可欠

UOMでは2018年4月から「Zabbixエンタープライズサポート」のみを対象に提供してきました。Zabbixのメリットは OSSなので無料で使えて、カスタマイズも自由な点です。人材や環境を含め、十分なリソースがある組織では、Zabbixの威力を十分に活用できるでしょう。

しかし、導入するシステムが巨大になればなるほど、監視で考慮したり工夫が必要な点が増えます。そして、インストールするインフラのサイジングや、データベースのチューニング、 バックアップなど、監視システムの保守運用で考慮すべきポイントもいろいろあります。その上、監視システムの特性上、キャパシティープランニングが非常に難しいのが現実です。実際、「どれだけの監視設定をするのか?」「どれだけの監視アラートが発生するのか?」監視すべき数量や項目数によって必要なキャパシティーが大きく変わってしまうため、極めて予測がしにくく計算式もあってないようなものです。

Zabbixを使うからといって、中小規模システム用のやり方を、そのままスケールアップして大規模なシステム用に簡単に転用できるわけではありません。

監視をどうこうしただけでは、システム運用全体は楽にならない

システム監視とシステム運用は切り離せないので、当然、Zabbixによる監視の部分だけに注目して済む話ではありません。

例えば、Zabbixが検知したアラートをどう処理するかは、基本中の基本です。メールだけでは、夜間や休日の障害を見落としてしまう可能性があるので、レガシーな手段ですが自動電話機能もあると確実。さらに、SNSへタイムリーにメッセージを通知できるとより安心です。

もちろん、Zabbixにアドオンを組み合わせていろいろなツールと連携させることも可能ですが、設定やカスタマイズが面倒です。何より、大規模システムですべての通知を設定するのは、設定・カスタマイズのみならず管理も結構な手間になります。

Zabbixからのアラート通知をフィルタリングで絞り込み、重要度の高いアラートだけを運用体制にあわせてメール/自動電話/SNSメッセージなどで通知するなど、システム運用全体を効率化することが重要です。

オンプレミスやクラウドが混在する今、監視対象との接続は厄介な問題

Zabbixの監視システムと監視対象は、ネットワーク的につながっていることが前提で、システムの規模が大きく、複雑になると、考慮しなければならない課題が増えます。

現代は、複数のパブリッククラウドサービスを組み合わせて使うマルチクラウドや、オンプレミスとプライベートクラウドを賢く使い分けるハイブリッドクラウドの時代。それぞれの環境ごとに監視システムを立てるケースもよく耳にしますが、果たして限られた現場の人材ですべてを管理できるでしょうか?

インターネット経由ですべてのシステムを監視できればいいですが、大規模システムだと、実際のところはそういったケースはまれです。

閉域網で接続しておかないとセキュリティ的にリスクがあるからといって、自社内で構築するようにシフトするにしても、結局、誰が運用保守するのか?という問題は避けられないわけです。

「マネージドモニタリング for Zabbix」開発に至る背景

IIJのリソースをフルに活かしたSaaSとして

2020年夏、Zabbixで仮想アプライアンス(ZS-V500)がリリースされ、IIJではこれを最大限に活用しようと考えました。オフィシャルパートナーであるIIJでは、従来からZabbixのサポートサービスを提供していることもあり、チューニングが施されたZabbixを使う意義は、非常に大きいと思いました。

そこで、パブリッククラウドとプライベートクラウドを融合したIaaSである、「IIJ GIOインフラストラクチャーP2」上にシステムを構築すれば、Zabbixサーバインフラは用意でき、システムリソースも必要な分だけ確保できると考えました。この環境を使って、Zabbixサーバと数千台分に相当する監視環境を構築し、負荷テストを繰り返し、Zabbixの設定やインフラのサイジングをした結果、大規模システムでも十分に利用できるスペックに仕上がりました。SaaSとして提供することで、お客さまには簡単かつスピーディーにご利用いただけるサービスになりました。

UOMの便利な機能をそのまま利用可能

元々UOMには、アラート通知として、メール/自動電話/SNSメッセージの通知機能があります。このソリューションでは、API連携されたZabbixから監視アラートが送られ、監視設定データもZabbixから取得されます。つまり、Zabbixで監視設定すると、その後のアラート通知設定までSI要らずで実現できます。また、検知したアラートはインシデントチケットとして自動起票されるので、チケット管理システムを作って連携する手間からも解放されます。

通常、このような連携の仕組みは、ユーザ側で作りこむ必要がありますが、UOMとZabbixが内部的に結合されているため、ユーザは連携を意識する必要がありません。一見、地味な連携ですが、一度設定しておけば、後はUOMの便利な機能をそのまま使うことができます。

閉域接続でセキュアに

オンプレミスやクラウドが混在する中で、どうやってZabbixとお客さまのシステムをつなげるか?という課題は、実はあまり大きな問題にはなりませんでした。というのも、Zabbixサーバは「IIJプライベートバックボーンサービス(以下、PBB)」を介してお客さまのシステムと接続できるように作られているからです。

閉域やWAN、クラウド接続を可能にするPBBにつながることは、必然的に、SaaS型のZabbixであっても、お客さまのネットワークにZabbixが直接接続できることを意味します。仮に、システム環境がオンプレミスやWAN、パブリッククラウドにまたがったハイブリッド環境でもまったく問題ありません。お客さまのシステムはセキュアに接続されるため、安心してご利用いただけます。


システム監視や運用という領域は、表からは見えづらい業務なため、ビジネス面での貢献が非常に判断しづらいのが現実です。直接、利益を上げる部門ではないので、費用ばかりが掛かるコストセンターだと誤解されることもあります。

しかし、これだけIT化やグローバル化が高速に進んでいる今、システムに何か障害が起きれば、ビジネスへのマイナスの影響も避けられません。大規模なシステムであればあるほど、そのネガティブなインパクトは無視できず、コンプライアンスやリスクマネージメント、事業継承を含む企業のガバナンスにも関わります。

ネットワークからインフラまでを含む長年の豊富なシステム運用実績があるIIJは、Zabbixを含むエンタープライズに最適なシステム監視と運用環境を提供します。

関連リンク

福原 亮

2020年10月01日 木曜日

サポートセンター勤務、システム監視運用設計担当を経てIIJ統合運用管理サービス(UOM)を始めとする、アウトソーシングサービスの企画/開発に従事。

Related
関連記事