SHARE

ニュース

【機能追加】Grafanaを活用したモニタリングダッシュボード機能を追加

「GMO GPUクラウド」は、GPUサーバーのリソースを可視化できるモニタリングダッシュボード機能の提供を開始しました。本機能は、オープンソースのデータ可視化プラットフォーム「Grafana(※1)」を活用し、GPUサーバーのリソース使用状況や、Slurm(※2)のジョブ実行状況を直感的に可視化します。複数のジョブ(※3)やワークロードの利用傾向をモニタリングすることで、GPUリソースの効率的な利用が可能となります。
本機能は「GMO GPUクラウド」の「専用プラン」で、追加料金なし(※4)でご利用可能です。

(※1)オープンソースのインタラクティブなデータ可視化プラットフォーム。
(※2)主にスーパーコンピュータや研究用の大きな計算機で使われる「ジョブ管理システム(スケジューラ)」の一種。
(※3)プログラムの実行内容・使うデータ・使う時間やメモリなどの条件をまとめたもの。
(※4)共用プランではご利用いただけません。

【モニタリングダッシュボード提供の背景】

 日々、繰り返しジョブを投入する運用では、個々のジョブの実行状況を追跡したり、長期間にわたって利用データを分析したりすることは容易ではありません。
 こうした課題を解決し、利用状況を直感的に可視化・分析できる環境を提供するため、Grafanaを導入したモニタリングダッシュボード機能を開発しました。

【モニタリングダッシュボードの活用シーン】

モニタリングダッシュボードでは、以下の項目を一画面上で確認することができます。

・ パーティションにおける実行中ジョブ数
・ パーティションにおける待機中ジョブ数
・ ユーザー別の実行中ジョブ数
・ ユーザー別の待機中ジョブ数

活用例1)ジョブが実行されている時間帯を可視化し、実行が集中している時間があれば分散するよう調整する。

活用例2)一定時間内におけるGPU利用率を確認し、パラメーターを調整することでリソース効率を最適化する。

■ダッシュボードのイメージ

▼詳しくは下記からお問い合わせください

関連記事

お問い合わせ

お問い合わせフォームにご入力いただき、送信ボタンをクリックしてください。

弊社担当からご入力いただいたメールアドレス宛にご連絡いたします。

*は必須項目です。
さらに詳細項目入力へ