NVIDIA Mellanox MCX4121A-ACAT Adapteur serveur en action. RDMA/RoCE Transport et serveur à faible latence.
April 22, 2026
Un fournisseur de services cloud à grande échelle a rencontré un défi familier lors de la création de son cluster de stockage distribué de nouvelle génération. À mesure que le cluster s'étendait à des centaines de nœuds, la surcharge du processeur et la gigue de latence de l'ordre de la microseconde inhérentes à la pile TCP/IP traditionnelle ont sévèrement limité les performances de NVMe-oF et des bases de données distribuées. Après une évaluation rigoureuse, l'équipe a sélectionné leNVIDIA Mellanox MCX4121A-ACATadaptateur de serveur pour mettre à niveau leur structure réseau, en tirant parti de la technologie RDMA/RoCE pour transformer fondamentalement les chemins de données.
Contexte et défi : le goulot d'étranglement TCP/IP dans le trafic est-ouest
Dans les centres de données modernes, le trafic est-ouest (la communication entre les serveurs) domine les schémas globaux de trafic. Pour la plate-forme de stockage distribuée du fournisseur, chaque opération d'E/S nécessitait plusieurs allers-retours réseau. La pile TCP conventionnelle consommait plus de 30 % des cœurs de processeur uniquement pour le traitement du protocole, introduisant des pics de latence imprévisibles qui dégradaient les performances des applications. L'équipe avait besoin d'une solution capable de contourner le noyau, de réduire l'intervention du processeur et de fournir une latence constante inférieure à la microseconde sur l'ensemble du cluster.
Solution et déploiement : déploiement du MCX4121A-ACAT pour le transport RoCE
Le fournisseur a déployé leCarte adaptateur Ethernet MCX4121A-ACATsur 120 nœuds de stockage, chacun configuré avec une connectivité 25GbE à double port. Construit sur l'architecture ConnectX-4 Lx, leMCX4121A-ACAT ConnectX-4 Lx double port 25GbE SFP28La conception a permis un déploiement transparent de RoCE (RDMA sur Ethernet Convergé) sans nécessiter d'infrastructure InfiniBand dédiée. Paramètres de déploiement clés inclus :
- Contrôle de flux prioritaire (PFC) et sélection de transmission améliorée (ETS) configurés sur tous les commutateurs ToR.
- Marquage ECN activé pour le transport RoCE sensible à la congestion.
- Rôles d'initiateur et de cible NVMe-oF mappés directement aux moteurs de déchargement matériel de l'adaptateur.
Selon leFiche technique MCX4121A-ACAT, le déchargement de transport basé sur le matériel de l'adaptateur élimine le besoin d'impliquer le processeur dans le mouvement des données. L'équipe a validé la compatibilité entre leur distribution Linux existante et l'optique SFP28, confirmant ainsi leCompatible MCX4121A-ACATl’écosystème répondait à toutes les exigences.
Résultats et avantages : gains mesurables en termes de débit et de latence
Les tests post-déploiement ont révélé des améliorations spectaculaires. Le tableau ci-dessous résume les principales mesures de performances avant et après la migration vers la solution MCX4121A-ACAT :
| Métrique | TCP 10 GbE hérité | MCX4121A-ACAT (RoCE) | Amélioration |
|---|---|---|---|
| Latence moyenne (4 Ko d'E/S) | 35µs | 2,1 µs | 16,6x inférieur |
| Utilisation du processeur (par 10 Gb/s) | 32% | 4% | Réduction 8x |
| Débit global (double port) | 18 Go/s | 49 Go/s | 2,7x plus élevé |
Au-delà des chiffres bruts, leSpécifications du MCX4121A-ACATtraduit en réels bénéfices opérationnels. La latence de réplication des bases de données distribuées a chuté de plus de 80 %, permettant des garanties de cohérence plus agressives. Les IOPS en lecture/écriture NVMe-oF ont doublé et les cœurs de processeur des nœuds de stockage précédemment consommés par le traitement de la pile réseau ont été réutilisés pour les services de données réels. Le fournisseur a également noté que leSolution de carte adaptateur Ethernet MCX4121A-ACATréduit leur coût total de possession : moins de nœuds étaient nécessaires pour atteindre les mêmes performances globales.
Pour les organisations évaluant des mises à niveau similaires, lePrix du MCX4121A-ACATle positionne comme une alternative rentable aux solutions d'interconnexion propriétaires. Plusieurs distributeurs sont désormais répertoriésMCX4121A-ACAT à vendreavec une tarification au volume, rendant les déploiements RoCE à grande échelle de plus en plus accessibles.
Résumé et perspectives : un modèle pour les centres de données à faible latence
Ce déploiement démontre que leNVIDIA Mellanox MCX4121A-ACATest plus qu'une mise à niveau de spécification : c'est un outil fondamental pour les systèmes distribués hautes performances. En combinant une bande passante double port 25 GbE avec un transport RoCE déchargé du matériel, l'adaptateur résout la tension de longue date entre les performances du réseau et l'efficacité du processeur. Alors que les clusters de formation à l'IA, le stockage désagrégé et les analyses en temps réel continuent d'exiger une latence plus faible et un débit plus élevé, le MCX4121A-ACAT constitue une voie à suivre éprouvée et prête pour la production. Les architectes réseau et les responsables informatiques à la recherche d'un adaptateur serveur fiable et hautes performances n'ont pas besoin de chercher plus loin que cette centrale ConnectX-4 Lx.

