RDMA/RoCE Transports à faible latence et débit de serveur

April 29, 2026

Dernières nouvelles de l'entreprise RDMA/RoCE Transports à faible latence et débit de serveur
Contexte et défi : Quand la surcharge CPU devient le goulot d'étranglement

Un laboratoire de recherche en IA en croissance rapide était confronté à un problème familier : leur infrastructure 100GbE offrait une bande passante à débit filaire, mais la latence des applications restait obstinément élevée. Les tâches d'entraînement distribué souffraient de gigue réseau fréquente, et l'accès au stockage NVMe-over-Fabrics ajoutait des délais imprévisibles. La cause profonde ? Les piles TCP/IP traditionnelles consommaient près de 30 % des cœurs CPU uniquement pour le traitement des paquets, laissant moins de puissance de calcul pour les charges de travail réelles. L'équipe avait besoin d'un changement fondamental : déplacer les données sans surcharger le CPU hôte. Cette recherche les a amenés à évaluer la carte réseau serveur Mellanox (NVIDIA Mellanox) MCX653105A-HDAT.

Solution et déploiement : Déploiement de RDMA/RoCE avec la MCX653105A-HDAT

Le laboratoire a déployé la MCX653105A-HDAT sur 24 nœuds de calcul, chacun équipé d'une connectivité 100GbE à double port. En tant que carte réseau PCIe native MCX653105A-HDAT ConnectX adapter PCIe network card, elle prend en charge RoCE (RDMA over Converged Ethernet) déchargé matériellement, permettant aux données de contourner le noyau et de se déplacer directement entre les régions mémoire. Le processus de configuration a été simple : après avoir vérifié la compatibilité des serveurs MCX653105A-HDAT compatible (Supermicro et Dell PowerEdge), les ingénieurs ont installé les derniers pilotes MLNX_OFED et activé RoCE avec le contrôle de congestion DCQCN. La carte réseau Ethernet MCX653105A-HDAT Ethernet adapter card a immédiatement déchargé le traitement réseau du CPU, réduisant la surcharge logicielle à près de zéro.

Pour le trafic de stockage, l'équipe a mappé des espaces de noms NVMe directement sur RDMA. La NVIDIA Mellanox MCX653105A-HDAT a géré le mouvement des données avec une latence inférieure à la microseconde, tandis que le routage matériel a assuré l'isolation entre les flux de calcul et de stockage. Selon la MCX653105A-HDAT datasheet, la carte prend en charge un débit agrégé allant jusqu'à 200 Gb/s et, en pratique, le laboratoire a atteint un débit de 100 GbE par port sans un seul paquet perdu sous pleine charge.

Résultats et avantages : Gains mesurables en latence et débit
  • Réduction de 50 % de la latence de bout en bout :Les tests MPI ping-pong sont passés de 2,8 µs (TCP) à 1,4 µs (RoCE).
  • Utilisation du CPU réduite de 70 % :Le traitement de la pile réseau a été entièrement déplacé vers le matériel, libérant des cœurs pour l'entraînement des modèles.
  • IOPS de stockage doublés :NVMe-oF sur RDMA a éliminé le pont logiciel, ramenant la latence en dessous de 10 µs pour les accès à petits blocs.

L'équipe a également validé les MCX653105A-HDAT specifications par rapport à leur environnement de production : interface PCIe 4.0 x16, conception thermique à double emplacement et prise en charge complète des notifications de congestion RoCE. Pour la planification de la capacité, ils ont examiné le MCX653105A-HDAT price par rapport au coût total de possession : la carte s'est amortie en moins de trois mois en réduisant l'étalement des serveurs et en améliorant la densité des charges de travail. Lors de la recherche de MCX653105A-HDAT for sale auprès de distributeurs agréés, ils ont trouvé plusieurs options de configuration (port unique, double port, avec ou sans démarrage sécurisé).

Métrique Avant (TCP) Après (MCX653105A-HDAT / RoCE) Amélioration
Latence MPI Ping-Pong 2,8 µs 1,4 µs -50%
Utilisation du CPU (Pile réseau) ~30% (8 cœurs) ~5% (déchargé matériellement) -83%
IOPS NVMe-oF à petits blocs 320k 680k +112%
Résumé et perspectives : Un modèle pour une infrastructure à faible latence

Ce déploiement confirme que la NVIDIA Mellanox MCX653105A-HDAT est plus qu'une simple carte réseau haute vitesse : c'est une plateforme complète d'accélération des données. En déplaçant le traitement réseau vers le matériel et en activant le véritable RDMA/RoCE, les organisations peuvent se libérer des contraintes réseau liées au CPU sans mises à niveau majeures. Que vous exécutiez de l'IA, des bases de données distribuées ou du stockage hyperconvergé, la carte réseau PCIe MCX653105A-HDAT ConnectX adapter PCIe network card offre une faible latence déterministe et un débit maximal. Pour les équipes qui planifient leur prochaine mise à niveau d'infrastructure, l'examen de la MCX653105A-HDAT datasheet et des MCX653105A-HDAT specifications est la première étape logique. La carte est largement MCX653105A-HDAT for sale auprès de distributeurs mondiaux, et la compatibilité avec les principales plateformes de serveurs assure une migration fluide. Comme l'a résumé un ingénieur : « La carte réseau Ethernet MCX653105A-HDAT Ethernet adapter card a transformé notre réseau 100 GbE d'un goulot d'étranglement en un multiplicateur de performances. »