プレミアム推論でAIの可能性を押し広げる
データフロー効率を高め、大規模モデルを高速かつ安定したスループットで実行します。
第5世代AIチップ「SN50 RDU」登場!
エージェント型AIに必要な速度とスループットを実現する唯一のチップ。エージェント型推論向けに特化した設計で、ワットあたり最高レベルのトークン性能を提供します。
SambaNovaとIntelが異種混合推論アーキテクチャの構想を発表。PrefillにはGPU、DecodeにはSambaNova RDU、エージェントツールにはIntel® Xeon® 6 CPUを活用。
エージェントに最適なゴルディロックスゾーン
SN50はエージェント型推論において競合チップと比較して3倍のコスト削減を実現します。共同創業者兼チーフ・テクノロジストのKunle Olukotun氏がSN50の階層型メモリによってモデルやプロンプト用キャッシュへのアクセスが可能になり、さらなる効率向上を実現する仕組みを解説します。
最高のオープンソースモデル で構築しよう
MiniMax M2.7
MiniMaxの最新フロンティアモデル「MiniMax M2.7」は、Mシリーズとして初めて自己進化プロセスへ深く関与するモデルです。
複雑なエージェント運用、マルチエージェント協調、高精度な生産性タスク向けに設計されており、SWE-Proで56.22%、VIBE-Proで55.6%、Terminal Bench 2で57.0%を記録しています。
さらにSambaNovaは、毎秒435出力トークンという圧倒的速度を実現し、他プロバイダーより3倍以上高速です。
DeepSeek
DeepSeek-R1(6710億パラ メータ)を含む先進的な
DeepSeekモデルに対応。 コーディング・推論・数学で高 性能を発揮し、他モデルの数 分の一のコストで利用可能。 SambaNovaのRDU上で毎秒 最大200トークンの高速推論を 実現(Artificial Analysis社調 べ)。
Meta Llama
MetaのLlama 4シリーズの ローンチパートナーとして、 SambaNovaはオープンソース AIの最前線をリードしています。
Llama 3.1の全モデル(8B、 70B、405B)にいち早く対応 し、高速推論を実現した最初 のプラットフォームです。
現在Meta社と連携し、Scoutお よびMaverickモデルでの高速 推論提供に取り組んでいます。
OpenAI gpt-oss-120b
OpenAIが最近公開したgpt-oss-120bは、Mixture of Experts(MoE)アーキテクチャを採用し、1200億パラメータながら高精度を実現するモデルです。
小規模かつ高効率なモデルであり、SambaNova RDU上では毎秒600トークン超という極めて高速な推論を実現し、
リアルタイムのエージェント型AIに最適です。
AIのために設計された、唯一 のチップからモデルまでのコン ピューティング基盤
推論 | 独自チェックポイント対応
SambaNovaは、AI推論向けの統合しやすいAPIを提供しており、アプリケーションを簡単に導入できます。 APIはOpenAI互換のため、既存アプリケーションを数分以内でSambaNovaへ移行可能です。
自動スケーリング | 負荷分散 | モニタリング | モデル管理 | クラウド構築 | サーバー管理
SambaOrchestratorは、データ センター全体にわたるAIワーク ロードの管理をシンプルにします。 モデルのデプロイ状況を簡単 にモニタリング・管理でき、ユー ザーの需要に応じて自動的に スケールします。
SambaRack™はAI推論ワークロード向けにデータセンターへ容易に導入できる最先端システムです。SambaRack SN40-16は第4世代システムとして低消費電力推論(平均10kWh)と複数モデルの同時実行に最適化されています。 SambaRack SN50は第5世代システムとして、高速エージェント型推論向けに最適化されており、
gpt-oss-120bやDeepSeekのような大規模モデルを低コストで実行できます。
SN40 | SN50 RDU
SambaNovaのイノベーション の中核を成すのが、RDU(再 構成可能データフローユニッ ト)です。
独自の3階層メモリアーキテク チャとデータフロープロセッシ ングを備えたRDUは、他の アーキテクチャと比べて圧倒的 に少ない消費電力で、はるか に高速な推論を実現します。
-
完全なAIプラットフォーム: エージェント、モデル、ナレッ ジ、データにまたがる、完全に 統合されたエンドツーエンドのエンジニアリングAIスタックを 提供します。
-
コンポーザブルなAIプラット フォーム:オープンで、構造化 データと非構造化データを統 合し、あらゆる環境でクエリを 実行可能で、あらゆるAIモデ ルにデプロイでき、AIエージェ ントを自ら構築することも、あら かじめ構築されたものを利用 することもできます。すべてに ビジネス認識を備えたインテリ ジェンスが組み込まれていま す。
-
ソブリンAIプラットフォーム: データのセキュリティとガバナ ンスを維持しながら、ビジネス チームはあらゆる環境でクエリ
-
を実行できます。ITは管理を維持しつつ、ビジネスチームはセ ルフサービスでAIを活用でき、 双方が本当に重要なことに集 中できます。



