ニュース
ニュース

「GMO GPUクラウド」は、GPUサーバーのリソースを可視化できるモニタリングダッシュボード機能の提供を開始しました。本機能は、オープンソースのデータ可視化プラットフォーム「Grafana(※1)」を活用し、GPUサーバーのリソース使用状況や、Slurm(※2)のジョブ実行状況を直感的に可視化します。複数のジョブ(※3)やワークロードの利用傾向をモニタリングすることで、GPUリソースの効率的な利用が可能となります。
本機能は「GMO GPUクラウド」の「専用プラン」で、追加料金なし(※4)でご利用可能です。
(※1)オープンソースのインタラクティブなデータ可視化プラットフォーム。
(※2)主にスーパーコンピュータや研究用の大きな計算機で使われる「ジョブ管理システム(スケジューラ)」の一種。
(※3)プログラムの実行内容・使うデータ・使う時間やメモリなどの条件をまとめたもの。
(※4)共用プランではご利用いただけません。
日々、繰り返しジョブを投入する運用では、個々のジョブの実行状況を追跡したり、長期間にわたって利用データを分析したりすることは容易ではありません。
こうした課題を解決し、利用状況を直感的に可視化・分析できる環境を提供するため、Grafanaを導入したモニタリングダッシュボード機能を開発しました。
モニタリングダッシュボードでは、以下の項目を一画面上で確認することができます。
・ パーティションにおける実行中ジョブ数
・ パーティションにおける待機中ジョブ数
・ ユーザー別の実行中ジョブ数
・ ユーザー別の待機中ジョブ数
活用例1)ジョブが実行されている時間帯を可視化し、実行が集中している時間があれば分散するよう調整する。
活用例2)一定時間内におけるGPU利用率を確認し、パラメーターを調整することでリソース効率を最適化する。
■ダッシュボードのイメージ

▼詳しくは下記からお問い合わせください
お問い合わせフォームにご入力いただき、送信ボタンをクリックしてください。
弊社担当からご入力いただいたメールアドレス宛にご連絡いたします。