SambaNova、DeepSeek-R1 671Bを最速・最高効率で提供開始

by SambaNova

2025年02月13日

SambaNovaは、DeepSeek-R1 671Bの推論を効率的に実行するためのハードウェア要件を1ラック（16基のAI半導体）に集約し、最新GPUの3倍の速度、5倍の効率を実現
SambaNovaは急速にキャパシティを拡大し、年末までにDeepSeek-R1向けのキャパシティを100倍に増強予定
SambaNova上のDeepSeekは、米国のデータセンターで安全かつプライベートに稼働
SambaNova CEOのロドリゴ・リヤンのコメント「SambaNovaは、フルサイズモデルであるDeepSeek-R1を大規模に展開し、高速かつ効率的に開発者向けに提供する最初の企業です」

カリフォルニア州パロアルト、2025年2月13日 – 最も効率的なAI半導体と最速のモデルを提供する生成AI企業であるSambaNovaは、本日DeepSeek-R1 671BがSambaNova Cloud上で198トークン/秒で稼働していることを発表しました。この速度と効率は他のプラットフォームでは実現できません。

DeepSeek-R1はAIのトレーニングコストを10分の1に削減しましたが、高い推論コストと非効率性が普及の障壁となっていました。 SambaNovaはこの障壁を取り除き、リアルタイムでコスト効率の高い大規模推論を開発者や企業向けに提供します。

SambaNovaのCEO兼共同創業者であるロドリゴ・リヤンは「SN40L RDU半導体によって駆動されるSambaNovaは、DeepSeekを198トークン/秒/ユーザーという最速の速度で実行できるプラットフォームです。この速度は単一ラックで最新GPUの5倍に達し、年末までにはDeepSeek-R1向けのキャパシティを100倍に拡張します」と述べています。

DeepLearning.AIの創設者であり、AI Fundのマネージング・ゼネラル・パートナー、スタンフォード大学コンピュータサイエンス学科の客員教授でもあるアンドリュー・ン博士は次のようにコメントしています。「SambaNovaの驚異的な速度で、蒸留されたバージョンではなく、フルサイズのDeepSeek-R1 671Bモデルを実行できることは、開発者にとって画期的です。R1のような推論モデルは、優れた出力を得るために多くの推論トークンを生成する必要があり、従来のLLMよりも処理時間が長くなります。したがって、このようなモデルの高速化は特に重要です。」

Artificial Analysisの共同創業者であるジョージ・キャメロン氏は「Artificial Analysisは、SambaNovaのクラウド上で稼働する6710億パラメータのDeepSeek-R1 Mixture of Expertsモデルの独自ベンチマークを実施し、195トークン/秒以上の出力速度を記録しました。これは、これまでに測定したDeepSeek-R1の中で最速の出力速度です。推論モデルにおいては、高速な出力が特に重要であり、推論トークンの出力速度が向上することで、応答の品質を向上させることができます。SambaNovaの高い出力速度は、レイテンシーに敏感なユースケースでの推論モデルの活用を支援します」と述べています。

SambaNovaがDeepSeekの最大の課題を解決：大規模推論の実現

DeepSeek-R1は、AIのトレーニングコストを10分の1に削減し、AIの発展を加速させました。しかし、推論時に必要な計算量が大幅に増大するため、GPUベースの推論の非効率性がDeepSeek-R1の普及を妨げ、多くの開発者にとって手の届かない存在となっていました。

SambaNovaはこの問題を解決しました。独自のデータフローアーキテクチャと3層メモリ設計により、SambaNovaのSN40L Reconfigurable Dataflow Unit（RDU）チップは、DeepSeek-R1 671Bを実行するためのハードウェア要件を、40ラック（最新GPU320基）から1ラック（16基のRDU）に削減し、コスト効率の高い推論を実現します。

SambaNova CEOのロドリゴ・リヤンは「DeepSeek-R1は最も先進的なフロンティアAIモデルの一つですが、GPUの非効率性がその可能性を制限していました。しかし、本日をもって状況は一変します。推論コストを劇的に削減し、ハードウェア要件を40ラックから1ラックへと縮小し、最高速で効率的なDeepSeek-R1を提供します」と述べています。

Blackbox AIのCEO、ロバート・リズク氏は「Fortune 500企業のエンジニアリングチームを含む1,000万人以上のユーザーが、Blackbox AIを活用してコードの作成や製品開発を変革しています。SambaNovaとの提携は、自律型コーディングエージェントのワークフローを加速させる上で極めて重要です。SambaNovaの半導体は、フルサイズのDeepSeek-R1 671Bモデルを効率的に提供できる唯一無二の性能を誇り、蒸留版よりも圧倒的に高い精度を実現します。数百万のユーザーを支えるために、これ以上のパートナーは考えられません」と述べています。

近日公開：世界で最も効率的なDeepSeek API – 現在のグローバルキャパシティの100倍

SambaNovaのチーフアーキテクトであるスムティ・ジャイラットは「DeepSeek-R1は、SambaNovaの三層メモリアーキテクチャに最適なモデルです。R1は6710億パラメータを持つ、これまでに公開された最大のオープンソース大規模言語モデルであり、その動作には膨大なメモリが必要となります。従来のGPUはメモリの制約を受けますが、SambaNova独自のデータフローアーキテクチャにより、メモリとデータ通信のボトルネックを克服し、近い将来にはラック全体で毎秒20,000トークンという前例のないスループットを達成できる見込みです。」と述べています。

SambaNovaは、今後の需要の増加に対応するため、計算能力の大幅な拡張を進めています。本年末までに、DeepSeek-R1向けのグローバルな計算リソースを現在の100倍以上に拡大する予定です。これにより、SambaNovaのRDUは、推論モデル向けの最も効率的なエンタープライズソリューションとなります。

SambaNova CloudでR1の早期アクセスを提供開始

DeepSeek-R1 6710億パラメータのフルモデルが、すべてのユーザー向けに提供開始されました。また、一部の選定ユーザーにはAPI経由での利用も可能です。今すぐ体験するには、cloud.sambanova.ai にアクセスしてください。

SambaNova Systems について

最先端の生成AI機能を企業内に迅速に展開するために、SambaNovaに注目が集まっています。 SambaNovaのエンタープライズスケールのために構築されたAIプラットフォームは、次世代の生成AIコンピューティングのための技術的バックボーンです。

カリフォルニア州パロアルトに本社を置くSambaNova Systemsは、業界の著名人や、サン／オラクルおよびスタンフォード大学のハードウェアおよびソフトウェア設計の専門家によって、2017年に設立されました。投資家には、SoftBank Vision Fund 2、BlackRock、Intel Capital、GV、Walden International、Temasek、GIC、Redline Capital、 Atlantic Bridge Ventures、Celestaなどが含まれています。sambanova.ai をご覧いただくか、info@sambanova.ai までご連絡ください。Linkedinで SambaNova Systems をフォローしてください。

お問合せ
SambaNova Systems Japan合同会社
林憲一
kenichi.hayashi@sambanova.ai

← AIリーダーシップ調査が示す準備不足：多くの企業がAIの膨大な電力需要に未対応

SambaNova、ソフトバンクと協業し、アジア太平洋地域全体で高速AI推論の提供を拡大 →