SambaNova Systems | Revolutionize AI Workloads

大規模推論

革新的なデータフロー技術とメモリアーキテクチャにより、拡大し続けるAIモデルに必要な性能と速度を実現します。

詳細はこちら →

エネルギー効率

最高レベルの電力効率でワットあたり最大数のトークンを生成することで、高速推論と優れたスケーラビリティを実現します。

詳細はこちら →

インフラの柔軟性

SambaStackは複数の最先端大規模モデルを切り替えながら利用でき、複雑なエージェント型AIワークフローを単一ノード上でエンドツーエンド実行できます。

詳細はこちら →

エージェントに最適なゴルディロックスゾーン

SN50はエージェント型推論において競合チップと比較して3倍のコスト削減を実現します。共同創業者兼チーフ・テクノロジストのKunle Olukotun氏がSN50の階層型メモリによってモデルやプロンプト用キャッシュへのアクセスが可能になり、さらなる効率向上を実現する仕組みを解説します。

MiniMax M2.7

MiniMaxの最新フロンティアモデル「MiniMax M2.7」は、Mシリーズとして初めて自己進化プロセスへ深く関与するモデルです。

複雑なエージェント運用、マルチエージェント協調、高精度な生産性タスク向けに設計されており、SWE-Proで56.22%、VIBE-Proで55.6%、Terminal Bench 2で57.0%を記録しています。

さらにSambaNovaは、毎秒435出力トークンという圧倒的速度を実現し、他プロバイダーより3倍以上高速です。

DeepSeek

DeepSeek-R1（6710億パラメータ）を含む先進的な

DeepSeekモデルに対応。コーディング・推論・数学で高性能を発揮し、他モデルの数分の一のコストで利用可能。 SambaNovaのRDU上で毎秒最大200トークンの高速推論を実現（Artificial Analysis社調べ）。

Meta Llama

MetaのLlama 4シリーズのローンチパートナーとして、 SambaNovaはオープンソース AIの最前線をリードしています。

Llama 3.1の全モデル（8B、 70B、405B）にいち早く対応し、高速推論を実現した最初のプラットフォームです。

現在Meta社と連携し、ScoutおよびMaverickモデルでの高速推論提供に取り組んでいます。

OpenAI gpt-oss-120b

OpenAIが最近公開したgpt-oss-120bは、Mixture of Experts（MoE）アーキテクチャを採用し、1200億パラメータながら高精度を実現するモデルです。

小規模かつ高効率なモデルであり、SambaNova RDU上では毎秒600トークン超という極めて高速な推論を実現し、

リアルタイムのエージェント型AIに最適です。

世界中に広がるソブリンAI

SambaNovaが支えるソブリンAIデータセンターパートナーのネットワークをご紹介します。各国の国内環境において、トップクラスの性能とオープンソースの柔軟性を提供します。

オーストラリア

ヨーロッパ

イギリス

推論 | 独自チェックポイント対応

SambaNovaは、AI推論向けの統合しやすいAPIを提供しており、アプリケーションを簡単に導入できます。 APIはOpenAI互換のため、既存アプリケーションを数分以内でSambaNovaへ移行可能です。

自動スケーリング | 負荷分散 | モニタリング | モデル管理 | クラウド構築 | サーバー管理

SambaOrchestratorは、データセンター全体にわたるAIワークロードの管理をシンプルにします。モデルのデプロイ状況を簡単にモニタリング・管理でき、ユーザーの需要に応じて自動的にスケールします。

SambaRack™はAI推論ワークロード向けにデータセンターへ容易に導入できる最先端システムです。SambaRack SN40-16は第4世代システムとして低消費電力推論（平均10kWh）と複数モデルの同時実行に最適化されています。 SambaRack SN50は第5世代システムとして、高速エージェント型推論向けに最適化されており、

gpt-oss-120bやDeepSeekのような大規模モデルを低コストで実行できます。

SN40 | SN50 RDU

SambaNovaのイノベーションの中核を成すのが、RDU（再構成可能データフローユニット）です。
独自の3階層メモリアーキテクチャとデータフロープロセッシングを備えたRDUは、他のアーキテクチャと比べて圧倒的に少ない消費電力で、はるかに高速な推論を実現します。

完全なAIプラットフォーム：エージェント、モデル、ナレッジ、データにまたがる、完全に統合されたエンドツーエンドのエンジニアリングAIスタックを提供します。
コンポーザブルなAIプラットフォーム：オープンで、構造化データと非構造化データを統合し、あらゆる環境でクエリを実行可能で、あらゆるAIモデルにデプロイでき、AIエージェントを自ら構築することも、あらかじめ構築されたものを利用することもできます。すべてにビジネス認識を備えたインテリジェンスが組み込まれています。
ソブリンAIプラットフォーム：データのセキュリティとガバナンスを維持しながら、ビジネスチームはあらゆる環境でクエリ
を実行できます。ITは管理を維持しつつ、ビジネスチームはセルフサービスでAIを活用でき、双方が本当に重要なことに集中できます。

News

SambaNovaとHume AI、超高速かつ多言語対応の音声言語モデルを発表グローバル企業向け会話AIを再定義

10月 1, 2025

Case study

OpenRouter uses SambaNova Cloud to deliver high speed LLM performance

5月 21, 2025

News

SambaNova、AIプラットフォームをAWS Marketplaceで提供開始

5月 29, 2025

プレミアム推論でAIの可能性を押し広げる

第5世代AIチップ「SN50 RDU」登場！

SambaNovaとIntelが異種混合推論アーキテクチャの構想を発表。PrefillにはGPU、DecodeにはSambaNova RDU、エージェントツールにはIntel® Xeon® 6 CPUを活用。

推論用に設計されたスタック

大規模推論

エネルギー効率

インフラの柔軟性

RDUデータフローアーキテクチャの仕組み

エージェントに最適なゴルディロックスゾーン

最高のオープンソースモデルで構築しよう

MiniMax M2.7

DeepSeek

Meta Llama

OpenAI gpt-oss-120b

世界中に広がるソブリンAI

AIのために設計された、唯一のチップからモデルまでのコンピューティング基盤

推論 | 独自チェックポイント対応

自動スケーリング | 負荷分散 | モニタリング | モデル管理 | クラウド構築 | サーバー管理

SN40 | SN50 RDU

SambaNovaとHume AI、超高速かつ多言語対応の音声言語モデルを発表グローバル企業向け会話AIを再定義

OpenRouter uses SambaNova Cloud to deliver high speed LLM performance

SambaNova、AIプラットフォームをAWS Marketplaceで提供開始

高速かつスケーラブルな推論を始めましょうか？

プレミアム推論でAIの可能性を押し広げる

第5世代AIチップ「SN50 RDU」登場！

SambaNovaとIntelが異種混合推論アーキテクチャの構想を発表。PrefillにはGPU、DecodeにはSambaNova RDU、エージェントツールにはIntel® Xeon® 6 CPUを活用。

推論用に設計されたスタック

大規模推論

エネルギー効率

インフラの柔軟性

RDUデータフローアーキテクチャの仕組み

エージェントに最適なゴルディロックスゾーン

最高のオープンソースモデル で構築しよう

MiniMax M2.7

DeepSeek

Meta Llama

OpenAI gpt-oss-120b

世界中に広がるソブリンAI

AIのために設計された、唯一 のチップからモデルまでのコン ピューティング基盤

推論 | 独自チェックポイント対応

自動スケーリング | 負荷分散 | モニタリング | モデル管理 | クラウド構築 | サーバー管理

SN40 | SN50 RDU

SambaNovaとHume AI、超高速かつ多言語対応の音声言語モデルを発表グローバル企業向け会話AIを再定義

OpenRouter uses SambaNova Cloud to deliver high speed LLM performance

SambaNova、AIプラットフォームをAWS Marketplaceで提供開始

高速かつスケーラブルな推論を始めましょうか？

最高のオープンソースモデルで構築しよう

AIのために設計された、唯一のチップからモデルまでのコンピューティング基盤