まず  ページニュース2026 AI 推論チップ戦争: Anthropic は社内チップ設計を模索、Nvidia は Groq を買収、巨人は覇権を争う

2026 AI 推論チップ戦争: Anthropic は社内チップ設計を模索、Nvidia は Groq を買収、巨人は覇権を争う

2026 AI 推論チップ戦争: Anthropic が社内チップ設計を模索、Nvidia が Groq を買収






2026 年の春、AI 業界は大きなニュースに動揺しました。ロイター通信によると、Anthropic は独自のチップを設計する可能性を模索しているとのことです。年間収益が 300 億ドルを超え、クロード モデルのユーザー ベースが急増しているこの AI ラボは、コンピューティング パワーの消費者からその定義者への進化を真剣に検討しています。

関係者らは、計画がまだ初期段階にあることを認めている。同社はまだ具体的な計画を最終決定したり、専門チームを結成したりしていません。Anthropic は最終的にはチップを自社で設計するのではなく、購入のみを選択する可能性があります。しかし、その可能性さえも雄弁に物語っている。

現在、Anthropic は、Google の親会社 Alphabet が設計した TPU (Tensor Processing Unit) と Amazon の Trainium チップの両方を使用して、Claude の開発と実行を行っています。ちょうど今週、同社は Google および Broadcom とも長期契約を締結しました。Broadcom は Google の TPU の中核的な設計サポーターです。数十億ドル規模の外部調達契約に署名し、同時に社内開発を密かに検討するこの二本柱のアプローチは、数年前のメタとマイクロソフトに不気味なほど似ており、現在はどちらも独自のカスタム チップを持っています。

業界の推計では、最上位の AI チップの設計には約 5 億ドルかかるとされていますが、価格以上に注目に値するのは、Anthropic の動きの背後にある業界のシグナルです。純粋なモデル企業が独自のシリコンの開発を真剣に検討し始めると、AI 推論をめぐるハードウェアの戦いは実際に新たなレベルの激しさに入ります。

推理が新たな戦場となる

過去 2 年間で、AI 業界は劇的な変化を遂げ、大量のコンピューティング能力の需要がトレーニング側から推論側に急速に移行しました。

トレーニング フェーズには数週間、場合によっては数か月かかる場合があり、並列コンピューティングには大規模な GPU クラスターが必要であり、この面での Nvidia の優位性はほぼ揺るぎません。しかし、推論は異なります。推論は、モデルがユーザーのリクエストに応答するたびに発生するリアルタイムの計算です。低遅延、高スループット、低エネルギー消費を追求しますが、これらの目標は GPU が得意とするものと完全には一致しません。

Barclays の予測によると、2026 年までに推論コンピューティングの需要は AI コンピューティングの総電力需要の 70% 以上を占め、トレーニング需要の 4.5 倍になります。今後のAIチップ市場における本当の決戦は推論にあると言える。

Nvidia はトレーニング エンドに 10 年間の堀を築いてきましたが、この堀を推論エンドまで拡張できなければ、業界構造全体の書き換えに直面することになります。このため、Nvidiaは昨年末に正式に動き、AI推論チップの新興企業Groqとの非独占的ライセンス契約を発表した。その後、Groq の創設者兼 CEO であるジョナサン ロス、社長のソニー マドラ、および数人のコア エンジニアが Nvidia に入社しました。外国メディアは内部関係者の話として、この取引の対価は約200億ドルであると伝えた。

Nvidiaの公式文言は慎重で、これは単なる技術ライセンスと人材の獲得であり、従来の買収ではないことを強調している。しかし、この非典型的な買収方法はシリコンバレーでは非常に一般的であり、ターゲットとなるテクノロジーとコアチームを実質的に関与させながら、面倒な独占禁止法の審査を回避することができます。

Groq のストーリーはもともと非常に注目に値します。創設者のロスは Google の TPU プロジェクトの中心メンバーであり、推論シナリオにおける GPU アーキテクチャの固有の制限、つまり数千の並列コンピューティング ユニットと非常に複雑なメモリ スケジューリング ロジックをよく知っていました。これらの機能はトレーニングでは利点がありますが、推論では予測できないレイテンシ ジッターを引き起こします。

このため、Groq はまったく異なる道を選択しました。つまり、ハードウェア レベルでスケジューラを完全に排除し、代わりにコンパイラにコード段階でデータのあらゆるビットのフロー パスを決定させることで、チップがナノ秒単位の精度で自動化された組立ラインのように動作できるようにしました。このアーキテクチャは、LPU (Language Processing Unit) と呼ばれます。主流の大規模モデルの推論テストでは、ワード生成速度が Nvidia GPU の 10 倍以上である一方で、トークンあたりのエネルギー消費量は Nvidia GPU のわずか 10 分の 1 です。

この卓越したパフォーマンスにより、Groq は 150 万人を超える開発者ユーザーを魅了し、Cisco、Samsung、BlackRock などのトップ機関から複数ラウンドの投資を受け、評価額は一時 69 億ドルに達しました。しかし、それを成功させたものは、同時に失敗にもつながりました。Groq のあまりにも眩しい推理パフォーマンスが、Groq をジェンセン ファンの目に閉じ込められる最も重要なターゲットにしたのです。

表面的には、Nvidia による Groq の買収は、推論側の技術レイアウトを補完することを目的としていますが、より深く言えば、それは防御的な統合です。Nvidia は、外部の最も強力な挑戦者の 1 社を自社のエコシステムに組み込むことで、独自のチップを開発する能力を持たない第 2 層のクラウド ベンダーや AI ソフトウェア会社から交渉の材料を奪い取っています。代替手段として Groq がなければ、Nvidia から「課税」されることを望まない人々の選択肢は突然狭まってしまいました。

巨人は剣を研ぐ

しかし、この絶望的な状況は長くは続かないかもしれません。

実際、Groq が台頭するずっと前から、大手クラウド大手はすでに独自のコンピューティング パワー パスを独自に計画していました。Google には TPU があり、Amazon には Trainium があり、Microsoft には Maia があります。これら 3 つの社内ルートはすべて、現在、外部に販売できる成熟段階に達しています。

コードネーム Ironwood と呼ばれる Google の第 7 世代 TPU は、2025 年末に正式にリリースされ、発売されました。前世代と比較して、そのシングルチップのパフォーマンスは 4 倍以上向上し、1 つのクラスターで最大 9,216 個のチップを相互接続できます。Google は、推論時代において最もコスト効率の高い商用エンジンである、この世代の製品の位置づけを秘密にしていませんでした。2015 年に内部コンピューティング能力のボトルネックにより社内開発を余儀なくされてから、2025 年に顧客自身のデータセンターへの TPU 導入を開放するまで、Google は 10 年をかけて緊急プロジェクトを戦略兵器に磨き上げてきました。Claude シリーズの将来のトレーニングと展開には最大 100 万 TPU が使用されるという Anthropic の発表により、Ironwood の商業的価値に対する市場の信頼がさらに高まりました。

アマゾンは別の道を歩もうとしている。AWSは長年、子会社のAnnapurna Labsが自社開発したチップに大きく依存してきた。Trainium シリーズは Nvidia GPU とほぼ同等ですが、クラウド インフラストラクチャのコストを削減し、外部サプライヤーへの依存を減らすことに重点を置いています。AWS が最近、Cerebras と複数年にわたる協力契約を締結し、Cerebras の Wafer-Scale Engine (WSE) チップをデータセンターに導入し、自社開発の Trainium チップと並行して導入することは、社内開発を優先し、外部調達で補うというこのロジックの具体的な現れです。

AWS の目標は非常に明確です。Trainium を使用して低速、低コストの推論需要に対応し、Cerebras チップを使用してレイテンシーに非常に敏感で、速度のために割増料金を支払うことをいとわないハイエンドの顧客を囲い込むことです。

推論チップの場合、短期的な速度を追求するトレーニング チップとは異なり、長期的なエネルギー効率に重点を置いています。Nvidia GPU は約 700 ワットを消費しますが、同等の計算能力を持つ専用推論チップは消費電力を 200 ワット以内に制御できます。数十万の推論チップを必要とする超大規模アプリケーションの場合、このギャップにより毎年数億ドルのコスト削減がもたらされる可能性があります。これが、Google、Amazon、Meta などのクラウド大手が ASIC 専用チップに賭けて競争している主な理由の 1 つです。

最新のニュースによると、Meta は Broadcom と 1Gw トレーニングおよび推論チップの協力協定に達し、すでに「混沌とした」推論チップ市場に新たな触媒をもたらすことになるでしょう。

異質な時代: 新たな同盟の出現

クラウド大手の社内研究開発ルートが十分なリソースの保証を伴った長期的な賭けであるとすれば、Intel と SambaNova の提携は、もう 1 つのより現実的な突破口となるでしょう。

2026 年に、SambaNova は Intel とのヘテロジニアス ハードウェア推論ソリューションの立ち上げを発表しました。これは 3 層アーキテクチャを採用しています。事前入力用の GPU、メイン制御および実行 CPU としての Intel Xeon 6 プロセッサ、およびエージェント AI ワークロード用に特別に設計されたデコード用の SambaNova RDU です。このソリューションは、2026 年後半に企業、クラウド サービス プロバイダー、ソブリン AI プロジェクトに公開される予定です。

SambaNova 氏は、純粋な GPU システムは並列化された事前入力リンクには優れていますが、実稼働環境での推論タスクでは、CPU のツール スケジューリングと専用の推論アクセラレータのデコード効率が、全体の速度とコストを決定する重要な変数であると指摘しました。

そのテストデータによると、Intel Xeon 6 プロセッサの LLVM コンパイル速度は、Arm アーキテクチャに基づくサーバー CPU の速度より 50% 以上高速であり、ベクトル データベースのパフォーマンスは最大 70% 高速です。これら 2 つの指標は、コード エージェント ワークフローの中核となるパフォーマンスのボトルネックを正確に解決します。

この協力におけるインテルの役割は興味深いものです。かつては PC の覇権国でしたが、GPU 時代には AI チップの主戦場からはほぼ疎外されました。現在、Xeon 6 の CPU 制御とスケジューリングの利点により、異種推論ソリューションにおける足場を取り戻しつつあります。データセンター ソフトウェア エコシステムは x86 アーキテクチャに基づいており、これによりインテルは AI ステージの中心に戻りました。

ビッグチップが脚光を浴びる

Cerebras は、別個に書く価値のある別の名前です。

ウェハースケールの AI チップに焦点を当てたこのスタートアップは、2024 年に IPO 申請を提出しましたが、その後取り下げたため、資本市場における同社の見通しに対する疑念が広まりました。しかしその後、OpenAI は ChatGPT にコンピューティング能力を提供するために、Cerebras と 100 億ドル以上相当の協力協定を締結しました。このニュースはセレブラスに再び世間の注目を集め、様子見していた機関にその技術的価値を再検討させるきっかけとなった。2026年2月、セレブラスは新たな10億ドルの資金調達ラウンドを完了し、資金調達総額は26億ドル、投資後の評価額は約230億ドルとなった。

Cerebras の中核テクノロジーは、ウェーハスケール エンジン (WSE) です。これはウェーハ全体を 1 つのチップとして使用し、従来のチップの物理的な切断制限を打ち破り、特定の推論タスクで非常に優れたレイテンシー パフォーマンスを実現します。Cerebras によると、推論デコード リンクにおけるチップの速度は、Nvidia GPU の最大 25 倍になる可能性があります。

AWS が最近発表した、AI 推論用のデータセンターに WSE チップを導入するセレブラスとの複数年にわたる協力契約は、このスタートアップにとって、資金調達の話から世界最大のクラウド プラットフォームのサプライヤーへの重要なアイデンティティの移行を示しています。

AWS による Cerebras の選択は、OpenAI と同じロジックに基づいています。つまり、プログラミング支援やエージェント タスクなど、応答速度に非常に敏感なシナリオでは、1 ミリ秒単位のレイテンシー削減がユーザー エクスペリエンスと商業的価値に直接対応します。これがまさに GPU の弱点です。

Cerebras にとって、AI を使用してますます困難な問題を解決する人が増えるにつれ、スピードへの要求は高まるばかりです。速度そのものが製品価値である場合、速度に対して割増料金を支払うのは自然な商業行為です。このロジックはますます多くの企業に受け入れられています。

CoreWeave: コンピューティングパワー市場の新たな中心点

コンピューティングパワー争いの背景には、インフラ供給側の再編がある。この目的において、CoreWeave の役割はますます不可欠になっています。

2025 年に、Meta は CoreWeave との供給契約を締結し、2031 年までに AI コンピューティング能力を 142 億ドル購入す​​ることに同意しました。最近 SEC に提出された文書によると、メタ社が契約に追加し、2032 年までに AI コンピューティング能力を追加で 210 億ドル購入す​​ることに同意した。この新たな契約の追加により、CoreWeave の受注残高は 878 億ドルに達し、そのうちメタ社だけで約 40% を占めている。

CoreWeave の台頭は、希少な商品からインフラストラクチャへの GPU コンピューティング能力の進化の縮図です。純粋なコンピューティング能力のレンタル者として、モデル機能は提供しませんが、モデルの実行を可能にする基礎的なサポートを提供します。クラウド大手 3 社以外にも、AI 企業はプラットフォーム エコシステムに束縛されないコンピューティング能力のオプションを必要としています。CoreWeave はまさにこのギャップを埋めるものです。

2025 年に、CoreWeave は前年比約 170% 増となる 51 億 3,000 万ドルの売上を達成しました。データセンター規模は43拠点に拡大し、使用電力容量は850メガワットとなった。同社は Nvidia H100 および H200 を中心に約 600,000 個の GPU を搭載しており、Blackwell シリーズの割合が増え続けています。契約された総電力容量は3,500メガワットに達し、これは現在の使用容量の4倍以上です。

ただし、CoreWeave の拡張ロジックは、最大の構造的圧力でもあります。データセンターの拡張費用を賄うため、同社は最近、47億5000万ドルの社債を私募すると発表した。手元現金は40億ドル未満で、2026年に300億~350億ドルの設備投資を完了するには、高速拡大を維持するには外部資金に依存する必要があることを意味する。CoreWeave の投資家は、コンピューティング能力の需要が長期的に高い割合で成長し続けるという中核的な判断に明らかに賭けています。

混沌は続く

Anthropic による社内チップ設計の探求、Nvidia による 200 億ドルでの Groq 買収、TPU をベンチマーク製品にするための Google の 10 年間の取り組み、差別化された推論ポートフォリオを構築するための Amazon の自社データセンターへの Cerebras の導入、ヘテロジニアス推論市場でのシェアを争うための Intel と SambaNova との提携など、一見バラバラに見える出来事はすべて、推論が新たな戦場であることを示しています。

AI の焦点が、より優れたモデルをトレーニングする方法から、より多くのリクエストをより低コストでより高速に推論する方法に移りつつあることに、ますます多くの人が気づいています。この変化は、以前の GPU 中心のコンピューティング パワー システムに大きな変革を引き起こしました。

この競争は、CPU を GPU に早期に置き換えることとは異なります。それは古い製品よりも新製品を一方的に好むというものでした。今日の推論チップをめぐる戦いは、むしろ複雑なエコシステム内での分業の再構築に似ています。単一のアーキテクチャがすべてのシナリオを支配することはできず、異種混合の組み合わせが主流になりつつあります。GPU は高度な並列プリフィルを処理し、専用の推論チップがデコードを担当し、CPU がスケジューリングと調整を担当し、クラウドとエッジ エンドにさまざまな焦点を当て、複数のプレーヤーが各リンクで競合します。

これは、結果がまだ決まっていないことを意味します。

Anthropic にとって、社内チップ設計の探求は、コンピューティング能力の自律性の積極的な追求であり、上流のサプライヤーによって人質に取られることを防ぐための保険でもあります。しかし、チップの研究開発サイクルが長く、多額の投資が行われていることから、この道は容易ではありません。Nvidia にとって、CUDA エコシステムの堀は依然として深いですが、推論側でのパフォーマンスとコストのギャップがますます明らかになり、潜在的なすべての挑戦者にとって共通の画期的な目標になりつつあります。Groq のような他の技術的競合企業にとって、技術的リーダーシップは必ずしも商業的な成功につながるわけではなく、買収される可能性は常に高まっています。

戦線は引かれており、参加者のリストはまだ増え続けている。この AI 推論コンピューティングパワーの混戦は、最も激しい章に入ったばかりです。