RoCE:パフォーマンスの複雑さをシンプルに
RoCEとは?
RDMA over Converged Ethernet (RoCE) は、Remote Direct Memory Access (RDMA) 機能を活用して、サーバークラスターおよびストレージアレイ上でホストされるアプリケーション間の通信を高速化するネットワークプロトコルです。
現在、複数の主要なAIモデルトレーニング企業が、高性能データセンター・ネットワークの技術ロードマップとしてRoCEネットワークを選択し、それに応じたアプリケーションテストを実施しています。RoCEネットワークは、オールフラッシュストレージの可能性を完全に解き放ち、様々なアプリケーションでの包括的な活用を可能にします。
  •   高性能データ転送
  •   CPU負荷の軽減
  •   データセンター効率の向上
  •   ネットワークアーキテクチャの簡素化
  •   ストレージアクセスの高速化
オープンネットワークエコシステムの複雑さ
RoCEソリューションは、スイッチの選択、ポートのカプセル化、サーバーNICの多様性において課題に直面しています。例えば、Cisco 400G QSFP-DDスイッチとNVIDIA ConnectX-7 QSFP112ネットワークカードを接続する場合、カプセル化タイプの違いにより相互接続の問題が発生します。
NADDODは、複数のカプセル化オプションを備えた光コネクタを提供することでこの課題に対処し、これらの相互接続の課題を克服し、システムのスムーズな動作を保証する包括的な接続性ソリューションをお客様に提供します。
NADDODがHPC/AIワークロードに提供するものは?
  • 光トランシーバー
    NADDODは、OSFP、QSFP-DD、QSFP56、QSFP28など、様々なパッケージングタイプを備えた幅広い光モジュール製品を提供しています。これらの多様なパッケージングオプションにより、様々なアプリケーションのニーズと要件を完全に満たすことができます。
  • AOC/DACケーブル
    NADDODのAOC/DACケーブルは、お客様の特定のニーズを満たすカスタマイズサービスを提供します。ケーブルの長さ、コネクタタイプ、ケーブル両端のモジュールパッケージングを、お客様の要件に応じて柔軟にカスタマイズできます。
  • スイッチング
    Broadcom Tomahawk 4/5 および NVIDIA Spectrum-X に基づく NADDOD AI データセンター スイッチには、あらかじめ以下がロードされています , これは、AIDC およびクラウド向けに信頼性の高い高性能なネットワーキング ソリューションを提供します。
ネットワーク高速化のための比類なき革新
このソリューションは、QSFP-DDスイッチとOSFPネットワークカードのための完璧な400G相互接続ソリューションを提供し、異なるポートカプセル化間の互換性問題に対処します。
NADDOD RoCE製品を選ぶ理由
オリジナル環境による100%互換性テスト済み
NADDODテストセンターは、完全に同一のオリジナル環境を再現し、各パーツをテストしてその性能を保証し、当社のイーサネットネットワーキング製品が140社以上のベンダーと100%互換性があることを確認します。 各コード化された製品は、互換性と相互運用性のために、シミュレートされた最終使用環境で専門的にテストされます。
おすすめ製品
RoCEトピックの関連記事
High-Performance GPU Server Hardware Topology and Cluster Networking-A100&H100

High-Performance GPU Server Hardware Topology and Cluster Networking-2

This article explores the hardware topology and cluster networking of high-performance GPU servers, focusing on typical 8-card A100/A800 and H100 host configurations. It delves into the internal structure, interconnections, and bandwidth analysis of various components, including NVSwitch, PCIe Gen4/Gen5, NVLink, and network cards. The article also discusses the impact of different networking options, such as the CX7 network card, on inter-node and intra-node communication.
Abel
Nov 20, 2023
NVIDIA Spectrum-X Solution Benefits and Product

NVIDIA Spectrum-X Solution Benefits and Product Components

Learn about the NVIDIA Spectrum-X solution, the world's first comprehensive end-to-end Ethernet solution designed for generative AI. Explore the benefits of Spectrum-X and its key product components, including the Spectrum-4 series switches, Bluefield-3 DPU network cards, LinkX 400G cables, and software solutions with hardware acceleration support. Discover how Spectrum-X addresses the limitations of traditional Ethernet in AI training and find out where to buy NVIDIA Spectrum-X products.
Gavin
Oct 30, 2023
RDMA application

High-Performance Computing: Analysis and Application of RoCE Technology

RoCE faces challenges in HPC: higher latency, flow control, and congestion control. Choosing the right network solution is crucial for high-performance AI data centers.
Jason
Oct 13, 2023
RDMA and Low Latency Networking

Exploring RDMA and Low-Latency Networks

RDMA technology, including RoCEv2 and PFC, enables ultra-low latency, lossless Ethernet, and congestion control for high-performance computing networks.
Peter
Nov 1, 2023
End-to-End RoCE Concept Principles

End-to-End RoCE Concept Principles

This article explores the concept principles of RoCE (RDMA over Converged Ethernet) technology, including its definition, differences from native InfiniBand RDMA, lossless network solutions, and performance optimization techniques. Gain insights into RoCE deployment, network configurations, and the benefits of lossy RoCE. Discover how NADDOD offers high-quality Ethernet interconnect products and can assist in optimizing your network infrastructure.
Dylan
Sep 25, 2023
RDMA

Why did RDMA emerge and what are its benefits?

RDMA technology enables low-latency, zero-copy networking with minimal CPU and memory resource consumption, revolutionizing data center communication.
Jason
Nov 3, 2023
InfiniBand In-network Computing:HPCおよびクラウドアプリケーションの高速化
探求する