インフラ

モダン監視について

keichan

はじめに

季節が変わり、春の訪れを感じる今日この頃、ITインフラストラクチャーの監視について考えてみませんか?keichanです。
今回は従来の監視手法とモダンな監視手法の違いについて解説し、その特徴を紹介します。

従来の監視手法の問題点

従来の監視手法では、サーバーやネットワークの稼働状況をSNMPなどのポーリングによって定期的にチェックし、
問題が発生した場合にアラートを発信するという方法が主流でした。
この手法では主にCPU・メモリという、サーバーのリソースを監視することが目的となることが多かったと思います。

ただ、現代のマルチテナント・マイクロサービスアーキテクチャにおいて、この監視手法では監視できる範囲に限界があることが問題でした。
考えられる問題点としては以下が挙げられます。

  1. 複数のリソースをまたいだ調査の難しさ: コンテナ・サーバーレス・仮想サーバー等複数のリソースにまたがるシステムを運用している場合、障害が発生した際の調査が複雑となり難易度が高くなってしまいます。異なるリソースごとにメトリクス・ログを確認しそれぞれを紐づけることが、現代のシステムアーキテクチャでは限界があります。

  2. サービス視点での障害発生検知が困難: リソース監視においてアラートが発生したとしても、サービス視点から見た際に障害が発生していない場合があります。例としてCPU使用率が90%を超えていても、サービスが正常に稼働していれば、サービス視点から見て異常は発生していないことになります。逆のパターンとして、リソース監視には何もアラートが発生していなくても、サービス視点から見ると異常が発生しており、正常に稼働していないパターンも考えられます。

上記以外にも、従来の監視手法でモノリスアーキテクチャでは対応できていた問題が、現代の複雑なシステムアーキテクチャでは対応できないようになってきています。

モダンな監視手法の特徴

モダンな監視手法では、従来のリソース監視を行わないわけではありません。
従来の監視に加え、以下のようなサービス視点からの監視を行うことがモダン監視では重要になります。

UI/UX監視

外形監視(Synthetic Monitoring)を活用し、運用者目線ではなく、ユーザー目線からシステムに異常がないか監視をすることがモダン監視では必要となります。
障害発生の検知をよりユーザーに近い視点から監視することで、迅速な対応が可能となります。

分散アプリケーションのデバッグ

X-RayやAPMツールを利用することで、分散アプリケーションのトレースを取得することが可能となります。
従来の監視では難しかった、複数リソースにまたがったアプリケーションを分析・デバッグすることが可能となります。

監視対象追加の自動化

従来の監視では、監視エージェントのインストールやConfigファイルの設定を手動で行うことが多かったと思います。
ホスト数が少ないアーキテクチャではそれでも対応が可能でしたが、現代アーキテクチャのようにスケーリングが前提となっていたり、
リソース数が膨大になってくると手動では対応が不可能となります。
エージェントのインストールを自動化し、設定ファイルをホストごとに対応するよう自動化することで、
スケーリングイベントが発生した場合においても、柔軟な監視設定が可能となります。

おわりに

今回は、従来の監視手法とモダンな監視手法について、簡単に説明してみました。
もちろん上記に書いた以外の要素も、モダン監視においては必要となるので、様々な情報のアップデートに対応していくことが重要となってきます。

AUTHOR
keichan
keichan
記事URLをコピーしました