GTC 2026参加レポート ~学習から推論へ。「推論爆発」が変えるAIインフラの未来~
【GTC 2026参加レポート】 ~学習から推論へ。「推論爆発」が変えるAIインフラの未来~ はじめに 2026年3月16〜19日、米国カリフォルニア州サンノゼで、NVIDIA主催の世界最大級AIカンファレンス「GTC 2026」が開催されました。GMOインターネットのエンジニアが現地に参加し、基調講演・展示ブース・各社個別ミーティングを通じて最新動向を取材しました。本レポートはその全容を、当社(GMOインターネット)の視点でまとめています。 【GTC2026概要】 開催期間2026年3月16〜19日(4日間)会場サンノゼ・コンベンションセンター/SAP Center(基調講演会場)来場者数30,000人以上(190カ国以上から参加)セッション数1,000セッション以上、スピーカー 2,000人以上スポンサー企業450社以上Inception参加スタートアップ240社以上ハンズオンラボ70以上特記事項CUDA誕生20周年、Jensen氏基調講演は2時間超(SAP Centerは満席) 昨年(GTC 2025)の来場者数は約25,000人(※1)。今年はさらに5,000人以上増加し、NVIDIAのJensen Huang CEOが「AIの産業時代の震源地」と表現した通りの熱気でした(※2)。 (※1)Wikipedia "Nvidia GTC"(2026年参照)— GTC 2025 drew about 25,000 attendees to San Jose.(※2)NVIDIA公式プレスリリース(2026年3月3日)— "GTC is the epicenter of the AI industrial era."出典:https://www.stocktitan.net/news/NVDA/nvidia-ceo-jensen-huang-and-global-technology-leaders-to-showcase-xp1xkmxzdkt8.html 主なセッションテーマ(公式カタログより抜粋): Agentic AI 101(AIエージェント入門) The Future of Industrial Autonomy(産業自律化の未来) Build Agentic Workflows for Financial Applications(金融向けエージェントAI構築) Disney's Robotic Characters: From the Screen to Reality via Physical AI(ディズニーロボットとフィジカルAI) Scale Model Training and AI Inference for Reasoning Models, Agents, and Robotics(推論モデル・エージェント・ロボティクスのスケーリング) Open Models, Data, and Tools for Agentic AI(エージェントAI向けオープンモデル) From Quantum Hardware to Accelerated AI Supercomputers(量子×AI) 出典:NVIDIA GTC 2026 Session Catalog — https://www.nvidia.com/gtc/session-catalog/NVIDIA Blog GTC 2026 Live Updates — https://blogs.nvidia.com/blog/gtc-2026-news/BizTech Magazine(2026年3月12日)— https://biztechmagazine.com/article/2026/03/nvidia-gtc-2026-what-expect-ais-biggest-event 【1. 会場・ブースの雰囲気】 フィジカルAIの展示(ロボット、デジタルヒューマン) 会場で最も目を引いたのは、フィジカルAI(ロボット・自動運転・デジタルヒューマン)の展示の多さです。昨年まで主役だったLLM(大規模言語モデル)デモは後退し、自動運転・産業ロボット・医療AIが独立ジャンルとして存在感を放っていました。会場内にはServe Roboticsの自律走行ロボット(AMR)が走行し、基調講演前の飲食物配達も担いました(※3)。 自動運転:RoboTaxiプラットフォーム対応各社(BYD、Hyundai、Nissan、Geely) ロボット:ABB、Universal Robots、KUKAなど産業ロボット大手 メディカル:Johnson & Johnson、Medtronic(NVIDIA IGX Thor搭載手術AIなど) GPUハードウェア:台湾ベンダーのB300空冷・水冷展示多数 スポンサーブースでは、Neo Cloud(新興クラウドGPUプロバイダー)の出展が際立ちました。グローバルでの推論インフラ競争の激化を肌で感じる場となった一方、日本企業の出展は依然として少ない印象でした。 (※3)NVIDIA Blog GTC 2026 Live Updates — "Over a dozen AMRs from Serve Robotics were seen throughout the GTC campus." 【2. 基調講演(Keynote)】 「推論爆発時代」の到来 今回のKeynoterの主なメッセージは「AIは学習の時代から推論の時代に入った」というものでした。 「データセンターは"データの保管場所"から"トークンを生み出す工場"へと変わった」 Jensen Huang(NVIDIA CEO) Jensen氏は、AI需要の見通しを5,000億㌦(GTC 2025時点)から1兆㌦(2027年まで)へと倍増すると発表。この需要の主役は「学習」ではなく「推論」であり、AIが動くたびにトークンが生み出され続ける時代が本格化するという宣言です(※4)。 (※4)Atlan GTC 2026 Keynote Recap(2026年3月19日)— "The session projected $1 trillion in AI infrastructure demand through 2027 and argued that inference has overtaken training as the dominant AI workload."出典:https://atlan.com/know/nvidia-gtc-2026-keynote-recap/ 次世代プラットフォーム「Vera Rubin」——Blackwellを大幅に超える推論効率 GTC 2025でNVIDIAは「Vera RubinはBlackwell Ultra比3.3倍」と予告。GTC 2026では「Blackwellプラットフォーム比で推論トークンコストを最大10分の1に削減」という形で改めて示されました。数値の基準(比較対象・精度種別)が異なるため単純比較には注意が必要ですが、ロードマップ自体は1年前の予告通りに進行していることが確認できます(※5)。 (※5)Exxact Blog GTC 2025 Recap — "Vera Rubin is planned for 2026 H2, delivering approximately 3.3x the performance of GB300 NVL72."出典:https://www.exxactcorp.com/blog/news/nvidia-gtc-2025-keynote-recap 推論特化ラックシステム「Groq 3 LPX」× NVIDIA Dynamoでメガワットあたり最大35倍のスループット NVIDIA Dynamo(OSSの推論エンジン)は、prefill(入力処理)フェーズとdecode(トークン生成)フェーズを専用ノードに分離することで、スループットを劇的に向上させます。Groq 3 LPXとの組み合わせにより、最大35倍の性能向上の実証についての説明がありました。 DynamoはGTC 2025で初発表されたOSS推論ソフトウェアです(Jensen氏は「AIファクトリーのOS」と表現)。GTC 2026ではDynamo 1.0として進化し、Groq LPXとの統合が具体化しました(※6)。 (※6)NVIDIA Blog GTC 2025 Live Updates — "Jensen Huang announced NVIDIA Dynamo, open-source software for accelerating and scaling AI reasoning models in AI factories."出典:https://blogs.nvidia.com/blog/nvidia-keynote-at-gtc-2025-ai-news-live-updates/ フィジカルAI——自動運転モデル「Alpamayo」が発表 NVIDIAが発表したAlpamayoは、車両の判断プロセスを自然言語でリアルタイムに説明する能力を持ちます。Jensen氏は「自動運転のChatGPTモーメントが来た」と表現しました。RoboTaxiプラットフォームにはBYD・Hyundai・Nissan・Geely・Uberが参画しています(※7)。 (※7)Atlan GTC 2026 Keynote Recap(2026年3月19日)— "The ChatGPT moment of self-driving cars has arrived." Disneyロボット「オラフ」がステージに登場——近々パーク内にも導入予定 基調講演のクライマックスでは、ディズニーの「アナと雪の女王」キャラクター「オラフ」のロボットがステージに登場。NVIDIA Jetson・Newton物理エンジン・Omniverse simulationで動作し、近々テーマパーク内への導入が予定されています(※8)。 GTC会場では「Disney's Robotic Characters: From the Screen to Reality via Physical AI」セッションも開催。NVIDIAとディズニーが共同で、アニメキャラクターをロボット化する際の技術的課題(モジュラー機電一体設計・深層強化学習・GPUシミュレーション)を解説しました。 (※8)BizTech Magazine(2026年3月12日)出典:https://biztechmagazine.com/article/2026/03/nvidia-gtc-2026-what-expect-ais-biggest-event AIエージェント——OpenClaw & NemoClaw OpenClawは史上最速で成長したOSSのAIエージェント基盤です。Jensen氏は「LinuxやHTMLに匹敵する」と評価しました。ホストマシン上でAPIキーや全ファイルへのアクセスを持つ柔軟な設計が特徴ですが、バグや攻撃による突破リスクも存在します。 NemoClawは、OpenClawの企業向けセキュリティ強化版です(Early Preview段階)。カーネルレベルの機構とゲートウェイを組み合わせた多層防御を実現しています。 次世代ロードマップ——2028年「Feynman」アーキテクチャを公開 2028年の次世代アーキテクチャ「Feynman」の構想が公開されました。新GPU・次世代LPU(LP40)・新CPU「Rosa」・BlueField 5を搭載予定です。 【3. GTC 2025ロードマップ予告 vs. GTC 2026実績】 昨年のロードマップ予告と今年の発表内容を照合した結果は以下の通りです。 項目GTC 2025(昨年)の予告GTC 2026(今年)の実績評価AIトレンドGenerative AI→Agentic AI・Physical AIへの推移を強調そのまま的中。「推論爆発」としてさらに強化✅ 的中推論シフト学習中心→推論へ移行。Dynamoを初発表推論がメインメッセージに。Dynamo 1.0として進化✅ 的中・加速Vera Rubin提供時期2026年下半期2026年下半期、正式量産開始を確認✅ 予定通りVera Rubin性能Blackwell Ultra比 3.3倍推論性能/ワット換算でBlackwell比 10倍(※基準が異なる点に注意)✅ 整合(詳細化)Rubin Ultra2027年下半期・Blackwell Ultra比14倍ロードマップ維持を確認✅ 的中Feynman「次世代アーキテクチャ」として存在示唆2028年。新GPU・LP40・Rosa CPU・BlueField 5の詳細公開✅ 詳細化ネットワーク帯域B300世代:3.2→6.4Tb/s / Rubin世代:6.4→12.8Tb/s同ロードマップ維持を確認✅ 的中NVIDIA Photonics(光NW)2025年末から導入開始予定GTC 2026でも引き続き推進中(具体的展開時期は要確認)△ 継続中DGX Spark / DGX StationGTC 2025で初発表。中小規模向け継続・拡充。NemoClawとの統合も発表✅ 的中AIエージェント基盤Agentic AI推進と示唆のみOpenClaw・NemoClawとして具体的プロダクト化🆕 大幅具体化フィジカルAI(自動運転)ロボット・自動運転へのAI展開を予告Alpamayo発表・RoboTaxi連合(BYD, Hyundai等)・Disneyロボット🆕 大幅具体化AI需要規模の見通し5,000億㌦規模(2025〜2026年)と示唆1兆㌦(2027年まで)へ倍増修正🆕 上方修正弊社取り組み(予定)コンテナネイティブ環境・推論プラットフォーム・Blackwell Ultra検討推論環境(K8s + KServe + vLLM)・Vera Rubin評価へ移行進捗中 総評:GTC 2025で予告されたロードマップはほぼ予定通りに進行しており、NVIDIAのアニュアルリズム戦略(年次で次世代製品を投入するサイクル)の信頼性が改めて確認できました。一方でAIエージェント基盤(OpenClaw/NemoClaw)・自動運転連合(RoboTaxi)・AI需要の1兆㌦上方修正など、昨年は予告されていなかった新展開も多数ありました。 (※9)NVIDIA Blog GTC 2025 Live Updates(2025年3月)— "NVIDIA will follow an annual rhythm for the buildout of AI infrastructure. Each year will bring new GPUs, CPUs and accelerated computing advancements."出典:https://blogs.nvidia.com/blog/nvidia-keynote-at-gtc-2025-ai-news-live-updates/ 【4. GTC 2026参加を踏まえた当社の今後の取り組み】 推論環境の構築 今回の講演を通じて推論時代の本格到来を改めて実感しており、推論環境の拡張を加速していきます。K8sをベースに「モデルデプロイ + APIエンドポイントの払い出し」をコア機能として作り込む方向で検討中です。技術スタックはKServe・vLLM・Run:AI等の組み合わせが候補として挙がっています。 Vera Rubin 推論性能は非常に魅力的ですが、完全水冷という点で従来のGPUとは運用面で大きく異なります。また、米国と比較して日本は推論プロダクトの市場規模がまだ小さく、Vera Rubin導入の妥当性については慎重に市場動向を見極めながら検討を進めます。 AIエージェント OpenClawやNemoClawの登場により、AIエージェントの重要性を再認識しました。まだ発展途上の領域ではありますが、実用性や制約を肌感覚で把握しておくことが不可欠です。今の段階から触れておくことで、将来の意思決定の精度を高めていきます。 【関連リンク】 リソースURLNVIDIA GTC 2026 公式https://www.nvidia.com/gtc/GTC 2026 セッションカタログhttps://www.nvidia.com/gtc/session-catalog/GTC 2026 キーノートオンデマンドhttps://www.nvidia.com/gtc/keynote/NVIDIA Blog GTC 2026 Live Updateshttps://blogs.nvidia.com/blog/gtc-2026-news/NVIDIA Dynamo(GitHub)https://github.com/ai-dynamo/dynamoGMO GPU Cloud 公式サイトhttps://gpucloud.gmo/ 本レポートは、GMOインターネット エンジニアチームによるGTC 2026参加レポートをもとに、当社見解として再構成したものです。引用・参照情報は掲載時点での最新内容に基づいていますが、NVIDIA製品仕様・提供時期は予告なく変更される場合があります。