目次
使用の前に
Q. Cloud Insightとは何ですか?
概要
Cloud Insighは、NAVERクラウドプラットフォームが提供する商品の性能指標を統合管理し、障害発生時に担当者に障害情報を迅速に伝えられるモニタリングサービスです。
データ収集
Cloud Insightを利用してNAVERクラウドプラットフォームの商品が提供する様々な性能指標を収集でき、Cloud Insightが提供するAPIを通じてユーザーアプリケーションの性能指標をCloud Insightで統合することもできます。
可視化
収集されたNAVERクラウドプラットフォームとユーザーアプリケーションの性能指標を一つのDashboardで可視化してサービスの運営状況を一目で確認でき、収集された性能指標をリソース容量と性能改善計画を準備するための基盤データとして活用できます。
モニタリングと通知
Cloud Insightは主なモニタリング対象の性能指標に対してしきい値を指定し、しきい値を超えた場合、それに対する通知を受け取る担当者を指定できます。これにより、障害が疑われる状況や障害発生時の処理担当者に、発生した問題をSMS/Emailで迅速に伝達できます。
Q. Cloud Insightのメリットは何ですか?
クラウド環境の可視性を確保
NAVERクラウドプラットフォームが提供する商品の性能指標だけでなく、ユーザーアプリケーションに対する性能指標もCloud Insightで統合できます。収集された指標を様々な表現方法で視覚化して1つのDashboardで構成し、クラウド環境の運用状況を一目で確認できます。Cloud InsightによってモニタリングできるNAVERクラウドプラットフォーム商品は、継続して追加される予定です。
運営に必要な洞察力を確保
たった一つのツールでクラウド環境の運用に必要な洞察力を得ることができます。Cloud Insightを利用してクラウド環境で起こっているすべての問題を追跡できるだけでなく、すべての性能/運用指標間の相関関係を視覚的に確認できます。これにより、運用管理者は解決すべき問題と原因、そしてその問題が及ぼす影響を迅速かつ容易に把握できます。
迅速な障害対応
直感的なUIのイベント設定により障害の状況を定義し、緊急度や担当者を簡単に指定できます。障害が疑われる状況や実際の障害が発生した場合は、事前に指定された担当者にSMSとEmailで問題が発生したこと伝え、運用担当者はこれによって発生した障害の要約情報を確認し、障害に迅速に対応できます。
アーキテクチャ
Cloud Insightが収集する性能指標をMetricと呼び、NAVERクラウドプラットフォームの各商品が提供するSystem Metricと、ユーザーがCloud Insight APIを通じて直接収集設定したCustom Metricに分けられます。Metricの種類に応じた詳細区分は、以下の表を参考にしてください。
区分 | 詳細区分 | 説明 |
---|---|---|
System Metric | Basic Metric | NAVERクラウドプラットフォームの各商品が提供する基本的な性能指標です。 別の設定なしにCloud Insightですぐに確認できます。 |
System Metric | Exteded Metric | NAVERクラウドプラットフォームの各商品が提供する追加機能指標です。 Cloud Insightで各商品の追加性能指標を確認するためには、各商品のコンソールによる収集設定が必要です。 |
Custom Metric | - | ユーザーアプリケーションなどNAVERクラウドプラットフォームが提供していない性能指標を、Cloud InsightのAPIを活用して収集した性能指標です。 |
提供性能指標
- Cloud Insightで性能指標を提供する商品は、次のとおりです。
区分 | 商品名 |
---|---|
Classic | Server |
VPC | VPC Server |
Classic | Load Balancer Monitor |
VPC | VPC Load Balancer Monitor |
Classic / VPC | Cloud Search |
VPC | Cloud DB for MySQL |
VPC | Cloud DB for MSSQL |
VPC | Cloud DB for Redis |
VPC | Cloud Hadoop |
VPC | Auto Scaling Group |
VPC | Kubernetes-Metrics |
- 各性能指標は、Cloud Insight API参照書の商品リストページで詳しく確認できます。
- Cloud Insightで性能指標を確認できる商品は、引き続き追加される予定です。
MetricとDimension
- Metricはユーザーが扱う値を意味します。Cloud Insightでは、MetricタイプでSTRING、INTEGER、LONG、FLOATに対応しています。
- DimensionはMetricの属性を意味します。そのMetricがどのサーバーに属しているのか、どんなところに位置しているのか、何の値であるのか、などをDimensionで定義できます。
集計と集計周期
- データは収集された形のままCloud Insightに保存されます。収集されたDataは、一定周期ごとに様々な集計関数を使って演算されます。
- 集計は1分(Min1)、5分(Min5)、30分(Min30)、2時間(Hour2)、1日(Day1)おきに実行されます。
- 現在のAVG、MIN、MAX、COUNT、SUMなどの集計関数に対応しています。
- 以下のようにデータが収集されたと仮定した場合、集計期間1分(Min1)に対する期待値は表のとおりです。
# 00時01分00秒から00時01分59秒まで下記のデータが収集されたとします。
00:01:10 - 1
00:01:20 - 2
00:01:30 - 3
00:01:40 - 4
00:01:50 - 5
時間 | 集計周期(Interval) | 集計関数(Aggregation) | 説明 | 期待値 |
---|---|---|---|---|
00:01 | Min1 | AVG | 集計期間内の平均値 | 3 |
00:01 | Min1 | MIN | 集計期間内の最小値 | 1 |
00:01 | Min1 | MAX | 集計期間内の最大値 | 5 |
00:01 | Min1 | COUNT | 集計期間内の収集回数 | 5 |
00:01 | Min1 | SUM | 集計期間内の合計 | 15 |
ダッシュボード
- ダッシュボードをモニタリング対象資源及び性能指標が含まれたウィジェットで構成できます。
- ダッシュボードは、Cloud Insightと連動しているNCP商品の基本的なマットを一目で確認できるよう構成されたService Dashboardとユーザーが直接作成するダッシュボードに区分されます。 画面で2つのダッシュボードを区分できるよう、Service Dashboardの場合はService Dashboard商品名の形式で表示されます。
Event Rule
- Event Rules作成を通じて監視が必要な対象、項目、条件、Event発生時のアクション(SMSEmail、Integrationなど)を設定することができます。
- Event Rules生成では、1つの監視対象に対して1つの項目を設定できますが、ユーザに便利なようにあらかじめ設定しておいた監視対象グループ(Target Group)と監視項目グループ(Rule Template)を指定することで、一度に複数のRuleを設定することもできます。 したがって、1つのEvent Rulesには複数のRuleが含まれることがあります。
メンテナンススケジュール
- 予定された作業で特定の期間にEventの発生に伴うアクション(SMSEmail、Integrationなど)を中断する必要がある場合、これに対するスケジュールを登録して、その期間中にアクションを中止させることができます。 この場合、Eventの発生に伴うアクションの発生が中断されるだけで、Eventは正常に発生します。
全体プロセス
コンソールにアクセスした後、次の手順によって簡単にCloud Insightサービスを申し込んで利用できます。
- コンソールにアクセスする
- コンソールにアクセスします。
- 利用申込み
- Products&Services > Management > Cloud Insight(Monitoring) > Subscriptionメニューをクリックした後、利用申込みボタンをクリックします。
- Dashboardの構成
- 統合モニタリングのために構成されたDashboardを確認できます。
- Event Ruleの設定
- 主なモニタリング対象のリソースと性能指標に設定されたEvent Ruleの設定状況を確認できます。
- 通知対象の管理
- 通知対象者に指定されたユーザーの携帯電話番号、メールアドレスを確認できます。
Event発生状況
- Event発生履歴を確認できます。
Planned Mainternanceの設定
- カレンダーまたはリストで、現在登録されているメンテナンススケジュールを確認できます。
サービスの解約
- Subscriptionメニューで利用設定 > 利用解約をクリックします。
使用限度
データ保管
Cloud Insightは収集した性能指標を最大1年間保管します。
性能指標の集計周期に応じて保管周期が異なります。詳細については、下記の表を参考にしてください。
集計周期(interval) | 保管期間 |
---|---|
1分周期 | 直近8日 |
5分周期 | 直近1ヶ月 |
30分周期 | 直近3ヶ月 |
2時間周期 | 直近6ヶ月 |
1日周期 | 直近1年 |
データ照会期間
データの集計周期によって照会可能期間が異なります。 詳細については以下の表をご参照ください。
集計周期(interval) | 推奨照会期間 |
---|---|
1分周期 | 最大1日 |
5分周期 | 最大一週間 |
30分周期 | 最大一ヶ月 |
二時間周期 | 最大一ヶ月 |
1日周期 | 最大一年 |
Dashboard
一つのDashboardには最大30個のWidgetを挿入できます。
APIの使用
Cloud Insight APIの1回の呼び出しによって取得できる性能指標は、最大20個に制限されます。