再構成可能データフローユニット(RDU)
AIのために設計された再構成可能なデータフローユニット (RDU)
SN50 登場
エージェント型推論向けに特化設計された第5世代チップのSN50は、エージェント型AIに求められる速度とスループットを実現する唯一のチップです。
データフローアーキテクチャ を採用したSN50は、第4世代のSN40と比較して5倍の計算性能と4倍のネットワーク帯域幅を実現し、ワットあたり最高レベルのトークン性能を提供します。
Seamlessly achieve high performance
From chips to racks
The combination of 16 SN40L RDUs creates a single, high-performance rack that can run the largest models, such as DeepSeek R1 671B and Llama 4 Maverick, with fast inference. These racks can be integrated seamlessly into any existing air-cooled data center.
Learn more →
AIのデータ移動問題を解決
データ移動は、AIを実行する際に最もコストのかかる処理です。
SambaNovaのRDUは、この課題を解決するために設計されており、RDUチップ上で組み立てラインのような処理フローを実現するアーキテクチャを採用しています。
当社のデータフローアーキテクチャ は、処理から処理へとデータをシームレスに受け渡し、大規模モデルの実行時に消費電力と処理時間を大幅に削減します。
Learn more →
階層型メモリが大規模モデル運用を支える
RDUは独自の3層メモリアーキテクチャを採用しており、最大規模の大規模言語モデル(LLM)へのスケーリングを可能にします。このインフラは複数のモデルの実行に対応できるだけでなく、それらのモデル間をミリ秒単位で切り替えることができます。
Learn more →
ゴルディロックスゾーンで実現する最高の速度とスループット
SambaNovaのRDUは、高スループットを維持しながら低レイテンシを実現し、ほぼリアルタイムの推論を必要とするAIコーディングエージェントのようなユースケースにおいて、優れたトークノミクスを提供します。
Learn more →Headline here
From chips to racks
The combination of 16 SN40L RDUs creates a single, high-performance rack that can run the largest models, such as DeepSeek R1 671B and Llama 4 Maverick, with the fast inference. These racks can be seamlessly integrated into any existing air-cooled data center.
Learn more →
エネルギー効率に優れたAI推論
当社のデータフローアーキテクチャは、GPUのようにメモリとの間でデータを何度もやり取りするオーバーヘッドなしに、卓越した性能を実現します。第4世代チップのSN40は、平均わずか10kWhで高速推論を実現し、SambaRackシステムを空冷で運用することを可能にしています。
Learn more →
AIのデータ移動問題を解決
16基のSN40L RDUを組み合 わせることで、DeepSeek R1 671BやLlama 4 Maverickと いった最大規模のモデルも高 速推論できる、高性能な1台の ラックが完成します。これらの ラックは、既存の空冷式データ センターにもシームレスに統合 可能です。
詳細はこちら →
クラウドスケール向けに設計
SambaNova SN50チップでは、新たに最大32,000基のRDUまで拡張可能なスケールアウトネットワークを搭載しています。これにより、クラウド規模の大規模推論サービスを実現でき、ネオクラウド事業者やハイパースケーラーなどの推論サービスプロバイダーにとって理想的なソリューションとなります。
Learn more →
Choose the right RDU for your organization
Future-proof your infrastructure
第4世代RDUのSN40と第5世代のSN50は、SambaNovaソリューションプラットフォームの中核を担っています。
Speed
RDUs are the only solution that run the largest AI models on a single system with blazing fast performance.
Learn more →
Energy
RDUs deliver the highest tokens per kilowatt-hour, which is ideal for data centers of all sizes.
Learn more →
Agentic
Three-tier memory architecture enables multiple models to run while switching between them. Perfect for AI agents.
Learn more →