ニュース
ニュース
~学習から推論へ。「推論爆発」が変えるAIインフラの未来~
はじめに
2026年3月16〜19日、米国カリフォルニア州サンノゼで、NVIDIA主催の世界最大級AIカンファレンス「GTC 2026」が開催されました。GMOインターネットのエンジニアが現地に参加し、基調講演・展示ブース・各社個別ミーティングを通じて最新動向を取材しました。本レポートはその全容を、当社(GMOインターネット)の視点でまとめています。

【GTC2026概要】
| 開催期間 | 2026年3月16〜19日(4日間) |
| 会場 | サンノゼ・コンベンションセンター/SAP Center(基調講演会場) |
| 来場者数 | 30,000人以上(190カ国以上から参加) |
| セッション数 | 1,000セッション以上、スピーカー 2,000人以上 |
| スポンサー企業 | 450社以上 |
| Inception参加スタートアップ | 240社以上 |
| ハンズオンラボ | 70以上 |
| 特記事項 | CUDA誕生20周年、Jensen氏基調講演は2時間超(SAP Centerは満席) |
昨年(GTC 2025)の来場者数は約25,000人(※1)。今年はさらに5,000人以上増加し、NVIDIAのJensen Huang CEOが「AIの産業時代の震源地」と表現した通りの熱気でした(※2)。
(※1)Wikipedia “Nvidia GTC”(2026年参照)— GTC 2025 drew about 25,000 attendees to San Jose.
(※2)NVIDIA公式プレスリリース(2026年3月3日)— “GTC is the epicenter of the AI industrial era.”
出典:https://www.stocktitan.net/news/NVDA/nvidia-ceo-jensen-huang-and-global-technology-leaders-to-showcase-xp1xkmxzdkt8.html
主なセッションテーマ(公式カタログより抜粋):
出典:NVIDIA GTC 2026 Session Catalog — https://www.nvidia.com/gtc/session-catalog/
NVIDIA Blog GTC 2026 Live Updates — https://blogs.nvidia.com/blog/gtc-2026-news/
BizTech Magazine(2026年3月12日)— https://biztechmagazine.com/article/2026/03/nvidia-gtc-2026-what-expect-ais-biggest-event
会場で最も目を引いたのは、フィジカルAI(ロボット・自動運転・デジタルヒューマン)の展示の多さです。昨年まで主役だったLLM(大規模言語モデル)デモは後退し、自動運転・産業ロボット・医療AIが独立ジャンルとして存在感を放っていました。会場内にはServe Roboticsの自律走行ロボット(AMR)が走行し、基調講演前の飲食物配達も担いました(※3)。

スポンサーブースでは、Neo Cloud(新興クラウドGPUプロバイダー)の出展が際立ちました。グローバルでの推論インフラ競争の激化を肌で感じる場となった一方、日本企業の出展は依然として少ない印象でした。
(※3)NVIDIA Blog GTC 2026 Live Updates — “Over a dozen AMRs from Serve Robotics were seen throughout the GTC campus.”
今回のKeynoterの主なメッセージは「AIは学習の時代から推論の時代に入った」というものでした。
「データセンターは”データの保管場所”から”トークンを生み出す工場”へと変わった」
Jensen Huang(NVIDIA CEO)
Jensen氏は、AI需要の見通しを5,000億㌦(GTC 2025時点)から1兆㌦(2027年まで)へと倍増すると発表。この需要の主役は「学習」ではなく「推論」であり、AIが動くたびにトークンが生み出され続ける時代が本格化するという宣言です(※4)。

(※4)Atlan GTC 2026 Keynote Recap(2026年3月19日)— “The session projected $1 trillion in AI infrastructure demand through 2027 and argued that inference has overtaken training as the dominant AI workload.”
出典:https://atlan.com/know/nvidia-gtc-2026-keynote-recap/
GTC 2025でNVIDIAは「Vera RubinはBlackwell Ultra比3.3倍」と予告。GTC 2026では「Blackwellプラットフォーム比で推論トークンコストを最大10分の1に削減」という形で改めて示されました。数値の基準(比較対象・精度種別)が異なるため単純比較には注意が必要ですが、ロードマップ自体は1年前の予告通りに進行していることが確認できます(※5)。
(※5)Exxact Blog GTC 2025 Recap — “Vera Rubin is planned for 2026 H2, delivering approximately 3.3x the performance of GB300 NVL72.”
出典:https://www.exxactcorp.com/blog/news/nvidia-gtc-2025-keynote-recap
NVIDIA Dynamo(OSSの推論エンジン)は、prefill(入力処理)フェーズとdecode(トークン生成)フェーズを専用ノードに分離することで、スループットを劇的に向上させます。Groq 3 LPXとの組み合わせにより、最大35倍の性能向上の実証についての説明がありました。
DynamoはGTC 2025で初発表されたOSS推論ソフトウェアです(Jensen氏は「AIファクトリーのOS」と表現)。GTC 2026ではDynamo 1.0として進化し、Groq LPXとの統合が具体化しました(※6)。
(※6)NVIDIA Blog GTC 2025 Live Updates — “Jensen Huang announced NVIDIA Dynamo, open-source software for accelerating and scaling AI reasoning models in AI factories.”
出典:https://blogs.nvidia.com/blog/nvidia-keynote-at-gtc-2025-ai-news-live-updates/
NVIDIAが発表したAlpamayoは、車両の判断プロセスを自然言語でリアルタイムに説明する能力を持ちます。Jensen氏は「自動運転のChatGPTモーメントが来た」と表現しました。RoboTaxiプラットフォームにはBYD・Hyundai・Nissan・Geely・Uberが参画しています(※7)。
(※7)Atlan GTC 2026 Keynote Recap(2026年3月19日)— “The ChatGPT moment of self-driving cars has arrived.”
基調講演のクライマックスでは、ディズニーの「アナと雪の女王」キャラクター「オラフ」のロボットがステージに登場。NVIDIA Jetson・Newton物理エンジン・Omniverse simulationで動作し、近々テーマパーク内への導入が予定されています(※8)。
GTC会場では「Disney’s Robotic Characters: From the Screen to Reality via Physical AI」セッションも開催。NVIDIAとディズニーが共同で、アニメキャラクターをロボット化する際の技術的課題(モジュラー機電一体設計・深層強化学習・GPUシミュレーション)を解説しました。

(※8)BizTech Magazine(2026年3月12日)出典:https://biztechmagazine.com/article/2026/03/nvidia-gtc-2026-what-expect-ais-biggest-event
OpenClawは史上最速で成長したOSSのAIエージェント基盤です。Jensen氏は「LinuxやHTMLに匹敵する」と評価しました。ホストマシン上でAPIキーや全ファイルへのアクセスを持つ柔軟な設計が特徴ですが、バグや攻撃による突破リスクも存在します。

NemoClawは、OpenClawの企業向けセキュリティ強化版です(Early Preview段階)。カーネルレベルの機構とゲートウェイを組み合わせた多層防御を実現しています。

2028年の次世代アーキテクチャ「Feynman」の構想が公開されました。新GPU・次世代LPU(LP40)・新CPU「Rosa」・BlueField 5を搭載予定です。
昨年のロードマップ予告と今年の発表内容を照合した結果は以下の通りです。
| 項目 | GTC 2025(昨年)の予告 | GTC 2026(今年)の実績 | 評価 |
|---|---|---|---|
| AIトレンド | Generative AI→Agentic AI・Physical AIへの推移を強調 | そのまま的中。「推論爆発」としてさらに強化 | ✅ 的中 |
| 推論シフト | 学習中心→推論へ移行。Dynamoを初発表 | 推論がメインメッセージに。Dynamo 1.0として進化 | ✅ 的中・加速 |
| Vera Rubin提供時期 | 2026年下半期 | 2026年下半期、正式量産開始を確認 | ✅ 予定通り |
| Vera Rubin性能 | Blackwell Ultra比 3.3倍 | 推論性能/ワット換算でBlackwell比 10倍(※基準が異なる点に注意) | ✅ 整合(詳細化) |
| Rubin Ultra | 2027年下半期・Blackwell Ultra比14倍 | ロードマップ維持を確認 | ✅ 的中 |
| Feynman | 「次世代アーキテクチャ」として存在示唆 | 2028年。新GPU・LP40・Rosa CPU・BlueField 5の詳細公開 | ✅ 詳細化 |
| ネットワーク帯域 | B300世代:3.2→6.4Tb/s / Rubin世代:6.4→12.8Tb/s | 同ロードマップ維持を確認 | ✅ 的中 |
| NVIDIA Photonics(光NW) | 2025年末から導入開始予定 | GTC 2026でも引き続き推進中(具体的展開時期は要確認) | △ 継続中 |
| DGX Spark / DGX Station | GTC 2025で初発表。中小規模向け | 継続・拡充。NemoClawとの統合も発表 | ✅ 的中 |
| AIエージェント基盤 | Agentic AI推進と示唆のみ | OpenClaw・NemoClawとして具体的プロダクト化 | 🆕 大幅具体化 |
| フィジカルAI(自動運転) | ロボット・自動運転へのAI展開を予告 | Alpamayo発表・RoboTaxi連合(BYD, Hyundai等)・Disneyロボット | 🆕 大幅具体化 |
| AI需要規模の見通し | 5,000億㌦規模(2025〜2026年)と示唆 | 1兆㌦(2027年まで)へ倍増修正 | 🆕 上方修正 |
| 弊社取り組み(予定) | コンテナネイティブ環境・推論プラットフォーム・Blackwell Ultra検討 | 推論環境(K8s + KServe + vLLM)・Vera Rubin評価へ移行 | 進捗中 |
総評:GTC 2025で予告されたロードマップはほぼ予定通りに進行しており、NVIDIAのアニュアルリズム戦略(年次で次世代製品を投入するサイクル)の信頼性が改めて確認できました。一方でAIエージェント基盤(OpenClaw/NemoClaw)・自動運転連合(RoboTaxi)・AI需要の1兆㌦上方修正など、昨年は予告されていなかった新展開も多数ありました。
(※9)NVIDIA Blog GTC 2025 Live Updates(2025年3月)— “NVIDIA will follow an annual rhythm for the buildout of AI infrastructure. Each year will bring new GPUs, CPUs and accelerated computing advancements.”
出典:https://blogs.nvidia.com/blog/nvidia-keynote-at-gtc-2025-ai-news-live-updates/
今回の講演を通じて推論時代の本格到来を改めて実感しており、推論環境の拡張を加速していきます。K8sをベースに「モデルデプロイ + APIエンドポイントの払い出し」をコア機能として作り込む方向で検討中です。技術スタックはKServe・vLLM・Run:AI等の組み合わせが候補として挙がっています。
推論性能は非常に魅力的ですが、完全水冷という点で従来のGPUとは運用面で大きく異なります。また、米国と比較して日本は推論プロダクトの市場規模がまだ小さく、Vera Rubin導入の妥当性については慎重に市場動向を見極めながら検討を進めます。
OpenClawやNemoClawの登場により、AIエージェントの重要性を再認識しました。まだ発展途上の領域ではありますが、実用性や制約を肌感覚で把握しておくことが不可欠です。今の段階から触れておくことで、将来の意思決定の精度を高めていきます。
| リソース | URL |
|---|---|
| NVIDIA GTC 2026 公式 | https://www.nvidia.com/gtc/ |
| GTC 2026 セッションカタログ | https://www.nvidia.com/gtc/session-catalog/ |
| GTC 2026 キーノートオンデマンド | https://www.nvidia.com/gtc/keynote/ |
| NVIDIA Blog GTC 2026 Live Updates | https://blogs.nvidia.com/blog/gtc-2026-news/ |
| NVIDIA Dynamo(GitHub) | https://github.com/ai-dynamo/dynamo |
| GMO GPU Cloud 公式サイト | https://gpucloud.gmo/ |
本レポートは、GMOインターネット エンジニアチームによるGTC 2026参加レポートをもとに、当社見解として再構成したものです。引用・参照情報は掲載時点での最新内容に基づいていますが、NVIDIA製品仕様・提供時期は予告なく変更される場合があります。
お問い合わせフォームにご入力いただき、送信ボタンをクリックしてください。
弊社担当からご入力いただいたメールアドレス宛にご連絡いたします。