運用監視サービス「雲の助」に対する開発者としての私の思い

先日の弊社代表国本のブログ記事にもありましたとおり、弊社ではこのたびAmazon Web Services(AWS)向けの運用監視サービス「雲の助(くものすけ)」をリリースいたしました。雲の助の概要についてはサービス紹介ページや、前述の国本の記事をご覧いただくとして、今回は、私下條が開発者の立場として「雲の助」によりお客様にご提供したい価値や思いについて書きたいと思います。

まずは私の経歴的な話となりますが、大学生時代にアルバイトでWebシステムの開発をしていました。そこでトラブル時の緊急対応がつらかった経験から、システムをあらかじめ監視しておくことの重要性を認識するようになり、就職先には電機メーカーでの監視ミドルウェアの開発職を選びました。その会社は3年前に辞めてしまったわけですが、このたび弊社がご提供する監視サービス「雲の助」の開発に携わっており、監視と縁の切れない仕事人生を歩んでいます。そういった経緯もあり、雲の助に対して強い思いを持ってサービス設計・開発を行っております。

今回はサービス設計・開発をする上で重視している以下の3点について思いを書きたいと思います。

  • お客様にいかに簡単に監視設定をしていただくか
  • お客様にいかにシステムの状態を簡単に把握していただくか
  • いかに監視を止めないか

お客様にいかに簡単に監視設定をしていただくか

何を監視すればいいのか、そしてどのようなパラメータで監視すればいいのか。監視は設計・設定が難しいものです。集められるあらゆるデータを監視するという考え方もありますが、そうするとどれが本当にクリティカルな情報なのか判断するのは難しくなります。慣れた方であれば、どういう設定でどういった監視をするかは経験から分かるものですが、監視に馴染みのない方には監視設計は難しいものです。

そのような中でいかにお客様に簡単に監視を始めていただけるかを考えて、雲の助のサービスを設計しています。雲の助では、お客様は弊社でのこれまでのノウハウを活かした推奨設定で簡単に監視を開始していただくことができます。ただし、当然ながらお客様のシステム構成、アプリケーションによって推奨される監視設定が変わってくるのも事実です。雲の助ではお客様のシステム構成を踏まえて監視設計をご提案することも可能ですので、お気軽にお問い合わせください!

お客様にいかにシステムの状態をポータルから簡単に把握していただくか

世の中にある監視ツールでは、いろいろと機能を盛り込もうとするあまり、ややこしいポータルとなっているものも多くあります。私は雲の助のポータル設計において以下の点を特に意識するようにしており、その上でメンバーで議論を重ね、機能設計を行っています。

  • お客様がシステムの状態を容易に把握できること。以下のポータルのイメージのように、ひと目でシステムの状態が分かるようにしています。

  • お客様にとって不要な情報を表示しないこと。開発者の自己満足的な機能や情報を追加しないように気をつけています。開発者としてはいろいろと機能を付けたくなるわけですが、それが本当にお客様のためになるのか、そしてお客様のためになるにはどのような機能・見せ方にすればよいかを熟考するようにしています。

いかに監視を止めないか

監視サービス自体が止まってしまっては当然監視はできません。雲の助では、

  • 監視に利用しているあらゆるコンポーネントを冗長化する設計としています。
  • 当然ながら監視用コンポーネント自体も監視し、異常があった場合にはすぐに復旧できる体制を取っています。

おわりに

雲の助では、いただいたフィードバックなども踏まえ、今後お客様にさらに大きな価値をご提供できるサービスに育てていきたいと考えています。
雲の助は、非常に容易な監視設定や、サービスの稼働状況が一目で分かるポータルなど、お客様にとって価値のあるサービスになっていると確信しております。興味のある方はこちらのページをご覧になり、お気軽にお問い合わせください。私も開発者として全力でサポートいたします!

余談

私は監視システムの行く先は、お客様に単にシステムの異常を知らせるだけのものとは考えていません。もちろん異常を早期検知・通知することでシステムの早期復旧につながり、ビジネス機会損失を減らすというのはお客様にとっての重要な価値と考えています。しかし、そもそもシステムは常に安定稼働していることが理想です。お客様はできれば障害通知を受けたくないはずです。深夜にビクビクする異常通知の電話を受けたい人はほとんどいないことでしょう。(私自身ももちろんイヤです。)

すなわち、そもそも異常が発生しないこと、そして異常が発生する前にシステムが自動的に復旧することが理想であり、監視サービスもそのような方向に進化していくべきではないかと考えています。

雲の助では現状でも、異常検知・通知に加えて、弊社プロフェッショナルサポートによる障害復旧や原因究明のサービスもオプションでご提供しています。しかし、将来的にはお客様のシステムの安定稼働をより強力にサポートするよう、例えば機械学習を活用した異常の予兆検知など、いかにシステムを安定稼働させるかを研究していき、お客様が安心してシステムの運用を任せられるようなサービスに育てていきたいと考えています。

このエントリーをはてなブックマークに追加