Dimensionnement des alimentations et configurations à double alimentation pour les serveurs d'IA multi-GPU
L'alimentation est le principal point faible de la plupart des configurations multi-GPU, et c'est aussi le problème le plus coûteux à résoudre par la suite : une alimentation sous-dimensionnée entraîne des redémarrages système aléatoires en pleine charge, tandis qu'une alimentation surdimensionnée représente un gaspillage de 400 € pour un appareil fonctionnant à 30 % de son rendement. La question de la double alimentation se complique encore, car la plupart des informations disponibles en ligne sur la « redondance » sont erronées dans le contexte d'une station de travail ou d'un serveur 4U équipé de GPU grand public.
Cet article présente les calculs, la réalité du format et le cadre honnête d'une configuration à 4 et 8 GPU sur le matériel que nous livrons réellement : RTX 5090, 4090, RTX Pro 6000 Blackwell (Workstation et Max-Q), L40 et L4, sur les plateformes hôtes EPYC.
Le calcul de la puissance totale
Le nombre qui vous intéresse est tirage mural soutenu sous charge réaliste, plus une marge suffisante pour que les pics de tension transitoires ne déclenchent pas la protection contre les surintensités du bloc d'alimentation. La formule est simple :
P_total = (GPU_TDP × N_gpu) + CPU_TDP + drives + fans + motherboard
P_psu = P_total / efficiency_at_load × 1.30 (30% headroom)
La marge de 30 % n'est pas arbitraire. Elle couvre trois aspects simultanément : les pics de consommation transitoires du GPU, la baisse d'efficacité lorsque l'alimentation dépasse environ 70 % de sa puissance nominale, et le fait que le TDP du GPU est un argument marketing que les charges de travail réelles peuvent parfois dépasser.
Valeurs TDP de référence utilisées pour le dimensionnement :
| Composant | TDP nominal | pic réaliste |
|---|---|---|
| RTX 5090 (FE / carte partenaire) | 575 W | transitoire de 600 à 650 W |
| RTX 4090 | 450 W | transitoire de 500 à 550 W |
| Station de travail Blackwell RTX Pro 6000 | 600 W | 600 W (plafond rigide) |
| RTX Pro 6000 Blackwell Max-Q | 300 W | 300 W (plafond rigide) |
| L40 | 300 W | 300 W (plafond rigide) |
| L4 | 72 W | 72 W (plafond rigide) |
| EPYC 9354 / 9374F (processeur hôte) | 280–320 W | Boost de 350 W |
| EPYC 9554 / 9654 (haute fréquence) | 360–400 W | W ~ 400 |
| SSD NVMe (par disque, en continu) | 8–12 W | impulsion de 15 W |
| Ventilateur industriel de 120 mm (par ventilateur) | 5–10 W | 10 W |
| Carte mère + barrettes DIMM (8× DDR5) | 80–120 W | 150 W |
Constat : les cartes graphiques pour stations de travail (Pro 6000, L40, L4) conservent leur TDP nominal de manière stable grâce à des limitations de consommation intégrées au firmware, conçues pour une charge soutenue en centre de données. Les cartes grand public (5090, 4090) connaissent quant à elles des pics de consommation. Une carte graphique 5090 consommera 600 W ou plus pendant quelques dizaines de millisecondes lors d'une transition de charge de travail. Multipliez cela par quatre cartes qui génèrent des transitoires déphasés les unes par rapport aux autres, et votre alimentation subit de brèves pointes bien supérieures à la moyenne en régime permanent.
C’est pourquoi le raisonnement « les calculs indiquent 1500 W, je vais acheter une alimentation de 1500 W » est la façon la plus courante dont une configuration à 4 cartes 5090 finit par redémarrer sous charge.
Pics transitoires — pourquoi la marge de manœuvre est réelle
Le comportement transitoire des GPU grand public de type Blackwell est bien documenté. Une 5090 consommant environ 30 W au repos peut atteindre 600 W en une seule milliseconde lors du lancement d'un noyau CUDA sur une file d'attente vide. Le VRM intégré atténue partiellement cette consommation, mais une fraction non négligeable est renvoyée vers l'alimentation. Une 4090 présente le même phénomène avec des pics de consommation d'environ 500 W.
Deux conséquences :
- Le point de défaillance est la protection contre les surintensités (OCP) du bloc d'alimentation.Il ne s'agit pas de la capacité moyenne d'une alimentation. Une alimentation de 1500 W avec une protection contre les surintensités (OCP) agressive, réglée à environ 130 % de sa valeur nominale, disjonctera lorsque quatre cartes graphiques 5090 connaîtront simultanément une surtension. Le redémarrage est silencieux : aucun journal d'événements, aucun avertissement, le système se remet simplement en marche. Diagnostiquer ce problème sans instrumentation prend des jours.
- Le temps de réponse de l'alimentation est plus important que sa puissance maximale. Les alimentations ATX haut de gamme et de qualité serveur possèdent une capacité de maintien qui leur permet d'absorber les surtensions transitoires inférieures à la milliseconde sans saturer le rail. Ce n'est pas le cas des alimentations bon marché ou anciennes. C'est pourquoi la différence de prix entre une alimentation industrielle de 2 kW et une alimentation grand public de 2 kW pour le jeu vidéo est bien réelle : il ne s'agit pas d'une simple question de marque.
La règle pratique que nous utilisons : Objectif : 70 % de la puissance nominale du bloc d’alimentation en régime permanent.Prévoyez 30 % pour les transitoires et la courbe de rendement. Une configuration à 4 cartes graphiques 5090 consommant environ 2.3 kW en continu nécessite une alimentation de 3 kW, ce qui correspond en pratique à deux alimentations ATX de 1500 W réparties entre les différents composants.
Plus de 80 évaluations : que signifient-elles réellement ?
Les niveaux de certification 80+ décrivent l'efficacité à 20 %, 50 % et 100 % de charge, avec une tension d'entrée de 115 V ou 230 V. Voici les valeurs pertinentes pour un serveur d'IA multi-GPU (fonctionnant généralement à environ 50 % de charge) alimenté par une source européenne de 230 V :
| Niveau | 20% de charge | 50% de charge | 100% de charge |
|---|---|---|---|
| 80+ Bronze | 81 % | 85 % | 81 % |
| 80 + Or | 88 % | 92 % | 88 % |
| 80+ Platine | 90 % | 94 % | 91 % |
| 80+ Titane | 94 % | 96 % | 94 % |
À 50 % de charge, l'écart entre les blocs d'alimentation Gold et Titanium est de quatre points de pourcentage. Sur un système de 2 kW fonctionnant 24 h/24 et 7 j/7, ces quatre points correspondent à environ 80 W en continu, soit environ 700 kWh par an. À 0.20 €/kWh, cela représente 140 € par an et par bloc d'alimentation. Le bloc Titanium est rentabilisé en moins de deux ans sur un serveur fonctionnant à pleine capacité ; le bloc Gold est le choix idéal si le système est inactif la moitié du temps.
Nous n'affichons pas les certifications 80+ Platinum ou Titanium sur les pages produits Kentino sans les avoir en notre possession. La grande majorité des alimentations ATX 2 kW que nous expédions sont certifiées Gold. Les clients ayant besoin d'une certification Platinum ou Titanium pour un déploiement en colocation 24h/24 et 7j/7 peuvent la demander en option ; nous nous chargeons de l'approvisionnement et du devis.
Alimentations ATX vs alimentations remplaçables à chaud de qualité serveur
La question du format se divise clairement :
ATX (alimentation unique, jusqu'à ~2 kW)
- Les châssis de stations de travail standard 4U acceptent une ou deux alimentations ATX.
- La puissance maximale pratique par unité ATX est d'environ 2 kW (la limite du circuit monophasé 240 V à 16 A est de 3.6 kW au total).
- Les câbles sont remplaçables par l'utilisateur, modulaires et le brochage des connecteurs est standard.
- Pas de remplacement à chaud. Une panne du bloc d'alimentation nécessite une reconstruction hors tension.
- Coût : 200 € à 500 € pour une unité ATX 2 kW sérieuse (Corsair AX, Seasonic PRIME, EVGA SuperNOVA G+, Super Flower Leadex).
CRPS (Common Redundant Power Supply, format serveur)
- Module d'alimentation pour serveur standard de l'industrie, ~73.5 mm × 185 mm × 40 mm.
- Utilisé dans les châssis de serveurs Supermicro, Tyan, Gigabyte et Bone64c.
- Véritable échange à chaud lorsqu'il est associé à un fond de panier redondant (1+1 ou 2+2).
- Puissances typiques : 1 200 W, 1 600 W, 2 000 W, 2 400 W, 3 000 W par module.
- Coût : 350 € à 700 € par module, plus le fond de panier.
Le cadre honnête des constructions Kentino :
- Les serveurs K-AI à 4 GPU sont livrés dans un châssis de station de travail/serveur 4U avec deux alimentations ATX — plus précisément deux de 1500 W ou deux de 2000 W selon la configuration des GPU.
- Les serveurs K-AI à 8 GPU sont livrés dans des châssis équipés de modules CRPS doubles ou quadruples d'une puissance unitaire de 2 000 à 2 400 W. C'est dans ces configurations que la redondance 1+1 devient une option pertinente, grâce à la compatibilité avec le fond de panier du châssis.
L'honnêteté de la double alimentation — alimentation divisée, pas N+1
Il s'agit de la spécification la plus mal interprétée sur le marché des configurations multi-GPU, et nous ne répéterons pas cette erreur.
Dans un châssis de station de travail 4U avec deux alimentations ATX :
Les deux alimentations ne sont pas redondantes. Elles alimentent des charges différentes. Un câblage typique est le suivant :
- Carte mère (ATX 24 broches)
- Processeur (EPS 8 broches)
- Lecteurs + ventilateurs
- GPU 1 (12V-2x6)
- GPU 2 (12V-2x6)
- GPU 3 (12V-2x6)
- GPU 4 (12V-2x6)
- (parfois : cage d'entraînement)
L'alimentation A tombe en panne → système hors service
Alimentation double ATX séparée. Pas de partage de rails, pas de basculement. Deux groupes de charge distincts.
Dans cette topologie, il n'existe pas de basculement automatique entre deux alimentations ATX. Les alimentations ATX ne partagent pas de rails. La sortie 12 V de l'alimentation A n'est pas reliée électriquement à la sortie 12 V de l'alimentation B. Les connecter ensemble créerait une boucle de courant et endommagerait l'une ou les deux alimentations.
La raison pour laquelle nous utilisons une double alimentation dans les configurations à 4 GPU et plus est la suivante : distribution d'énergie diviséeUne seule alimentation ATX de 2 kW à 70 % de charge semble suffisante sur le papier, mais le câblage à lui seul — quatre ports PCIe pour les cartes graphiques, la carte mère et le câble EPS — est physiquement très difficile à gérer. Répartir le tout en deux alimentations de 1500 W ou 2000 W permet de réduire de moitié la masse des câbles de chaque côté, de diviser par deux la charge thermique par unité et d'offrir une solution de secours à deux cartes graphiques en cas de panne d'une alimentation, plutôt qu'une panne système complète.
Le CRPS dans un châssis de serveur est différent. Un fond de panier CRPS 2+2 avec quatre modules de 2 kW et des paires redondantes 1+1 permet un véritable remplacement à chaud ; la défaillance d'un module n'entraîne pas l'arrêt du système. Il s'agit de la configuration serveur 8 GPU, et nous l'indiquons clairement sur la page produit lorsqu'une configuration est livrée avec ce fond de panier. C'est également cette configuration qui justifie l'affirmation « alimentation redondante ». Nous ne faisons pas cette affirmation pour les configurations ATX 4 GPU, car ce serait inexact.
Équilibrage des rails et limites de courant par rail
Les alimentations ATX haut de gamme modernes sont par défaut des modèles 12 V à rail unique, ce qui simplifie les choses : la tension de sortie de 12 V est concentrée sur une seule source, et la seule limite est la puissance totale de l'alimentation. Une alimentation de 2 000 W à rail unique fonctionnant sous 230 V peut fournir environ 166 A sous 12 V, ce qui est largement suffisant pour n'importe quelle carte graphique.
Certaines alimentations plus anciennes ou industrielles sont multirails (12V1, 12V2, 12V3, 12V4), chacune avec une limite de protection contre les surintensités (OCP) de 20 à 40 A généralement. Cela a son importance dans deux cas :
- Vous connectez un 5090 avec sa prise 12V-2x6 (successeur du 12VHPWR) à un seul rail 12 V. Un 5090 à une puissance de crête transitoire de 600 W consomme 50 A sous 12 V. Un disjoncteur multirail de 40 A se déclenchera.
- Vous connectez deux GPU au même groupe de ports multi-rails. Même problème, doublé.
Solution pratique : pour les configurations multi-GPU, utilisez une alimentation 12 V à rail unique. Les alimentations multi-rails sont obsolètes, datant de l’époque où la protection contre les surintensités (OCP) 12 V était une mesure de sécurité sur les systèmes de jeu mono-GPU. Elles sont totalement inutiles dans un boîtier équipé de quatre cartes graphiques RTX 5090.
Une configuration en béton avec 4 GPU 5090
Résultats d'une configuration K-AI 96 Turin représentative avec 4 cartes graphiques RTX 5090 :
Component Sustained Peak
--------- --------- ----
4× RTX 5090 4 × 500 W = 2000 W 4 × 600 W = 2400 W (transient)
EPYC 9354 (32-core, 280 W) ~ 250 W 350 W
Motherboard + 8× 64 GB DDR5 ~ 100 W 150 W
2× NVMe SSD ~ 20 W 30 W
4× 120 mm industrial fans ~ 30 W 40 W
-------- --------
Total system ~ 2.4 kW ~ 3.0 kW transient
Dimensionnement de l'alimentation : 3.0 kW en transitoire / 0.92 (Gold à 50 % de charge) = budget d'alimentation de 3.26 kW. Arrondir à l'unité supérieure. 2 alimentations ATX de 1500 W ou 2 alimentations ATX de 2000 W, rail unique, or ou mieux, divisé comme :
- Alimentation A (2000 W) : carte mère, processeur, disques durs, ventilateurs, GPU 1, GPU 2
- Alimentation B (1500 W) : GPU 3, GPU 4
La variante 2× 2000 W est celle que nous recommandons aux clients qui souhaitent avoir une marge de manœuvre pour passer ultérieurement aux cartes RTX Pro 6000 Workstation (600 W chacune, limite plus stricte sur les transitoires, mais un plafond soutenu de 2.4 kW dans les deux cas).
Une configuration en béton avec 8 GPU 5090
Caractéristiques d'une configuration K-AI 256 Turin Dual avec 8 cartes graphiques RTX 5090 :
Component Sustained Peak
--------- --------- ----
8× RTX 5090 8 × 500 W = 4000 W 8 × 600 W = 4800 W (transient)
2× EPYC 9554 (64-core, 360 W) ~ 650 W 800 W
Motherboard + 16× 64 GB DDR5 ~ 180 W 250 W
4× NVMe SSD ~ 40 W 60 W
8× industrial server fans ~ 80 W 120 W
-------- --------
Total system ~ 5.0 kW ~ 6.0 kW transient
Dimensionnement de l'alimentation : 6.0 kW en transitoire / 0.94 (CRPS Platinum à 50 % de charge) = budget d'alimentation de 6.4 kW. La configuration standard est : modules CRPS doubles de 2000 W au minimum, plus fréquemment 2+2 CRPS à 2000–2400 W chacun avec un fond de panier redondant.
C’est dans cette configuration qu’une véritable redondance 1+1 est justifiée. Le surcoût d’investissement par rapport à un serveur à double alimentation non redondante est d’environ 800 à 1 200 € par configuration.
L'alimentation en 240 V est importante ici. Un système 5090 à 8 GPU alimenté par un circuit monophasé 230 V 16 A consomme 73 % du courant nominal continu du disjoncteur, soit la limite supérieure de la consommation continue autorisée par la plupart des réglementations. Pour tout déploiement à 8 GPU, nous recommandons un circuit de 32 A ou une unité de distribution d'alimentation triphasée (PDU) en rack avec 230 V par phase.
Dimensionnement de l'ASI
Si vous installez un serveur d'IA à 4 ou 8 GPU sur un onduleur (ce que vous devriez faire, au minimum pour un arrêt en douceur), le calcul est le suivant :
- Configuration à 4 GPU : 2.4 kW en continu. Un onduleur en ligne de 3 kVA / 2.4 kW assure une protection complète, mais une autonomie minimale (environ 5 minutes à pleine charge). Pour un arrêt propre, c'est suffisant.
- Configuration à 8 GPU : 5 kW en continu. Un onduleur en ligne de 6 kVA est le minimum requis. Pour une autonomie réelle de 10 minutes en pleine charge, il vous faudra un onduleur de 10 kVA ou deux onduleurs en parallèle.
Un onduleur sous-dimensionné pour la pointe de consommation transitoire se mettra en sécurité ou s'arrêtera dès que la consommation des GPU atteindra un pic. La puissance nominale de l'onduleur doit couvrir la pointe transitoire, et non la moyenne soutenue. La double conversion en ligne est la topologie idéale pour le calcul en IA. Les unités interactives en ligne ont un temps de transfert de 4 à 10 ms, ce qui peut parfois entraîner le plantage des tâches d'inférence lors de la transition. Il faut privilégier une sortie sinusoïdale pure plutôt qu'une sortie sinusoïdale modifiée : les alimentations ATX et CRPS modernes supportent mal les sorties sinusoïdales modifiées à forte charge.
Tableau récapitulatif — Recommandations d'alimentation par classe de configuration
| Se construisent | Accéléré | Transitoire | Configuration de l'alimentation | Demande de licenciement |
|---|---|---|---|---|
| 1 poste de travail 4090 / 5090 | W ~ 700 | 900 W | 1 alimentation ATX Gold de 1200 W, rail unique | Aucun |
| 2 × 4090 | ~ 1.2 kW | 1.5kW | 1 alimentation ATX Gold de 1600 W, rail unique | Aucun |
| 4 × 4090 | ~ 2.0 kW | 2.6kW | 2 alimentations ATX Gold de 1500 W, livraison séparée | Aucun (partagé) |
| 4 × 5090 | ~ 2.4 kW | 3.0kW | 2 alimentations ATX Gold de 1500 à 2000 W, livrées séparément | Aucun (partagé) |
| 4× RTX Pro 6000 (Station de travail) | ~ 2.6 kW | 2.8kW | 2× 2000 W ATX Or/Platine | Aucun (partagé) |
| 8 × 5090 | ~ 5.0 kW | 6.0kW | 2 CRPS de 2000 W ou 2+2 CRPS à 2000 W | 1+1 (CRPS uniquement) |
| 8× RTX Pro 6000 (Station de travail) | ~ 5.5 kW | 5.7kW | 2+2 CRPS à 2400 W | 1+1 (CRPS uniquement) |
| 8× L40 / 8× L4 (inférence) | 2.6/0.7 kW | même | 2 alimentations ATX de 1500 W ou 1+1 alimentations CRPS de 1600 W | Optionnel |
Les performances des processeurs L40 et L4 expliquent l'intérêt de ces cartes : un serveur d'inférence 8× L4 fonctionne avec une seule alimentation ATX de 1 200 W, avec une marge confortable, et s'intègre dans n'importe quel circuit électrique de bureau. Toutes les charges de travail ne nécessitent pas une architecture Blackwell.
Que faire ensuite
Si vous dimensionnez une configuration, voici les questions auxquelles il est important de répondre avant de choisir l'alimentation :
- Quel est le modèle exact du GPU et combien en compte-t-on ? Pic transitoire par carte × N, et non TDP nominal × N.
- S'agit-il d'un châssis de station de travail 4U ou d'un châssis de serveur avec fond de panier CRPS ? Cela détermine si l'alimentation double est à distribution séparée ou s'il s'agit d'une véritable redondance 1+1.
- Quel est votre circuit ? Une alimentation de 230 V et 16 A convient pour 4 GPU. Pour 8 GPU, il faut 32 A ou une alimentation triphasée. Aux États-Unis, le réseau électrique 110/120 V ne permet pas d'alimenter une RTX 5090 (8 GPU) sur un seul circuit.
- Quel est le cycle de service ? Une utilisation continue 24h/24 et 7j/7 justifie l'utilisation d'une alimentation Platinum ou Titanium. Pour des sessions de formation ou de développement intermittentes, une alimentation Gold est suffisante, permettant d'économiser 400 € par configuration.
- Avez-vous réellement besoin de redondance, ou avez-vous simplement besoin d'une solution de repli élégante à 2 GPU ? Ce sont deux choses différentes. La double interface ATX permet d'obtenir la seconde. Seul un fond de panier CRPS permet d'obtenir la première.
Si vous pouvez répondre à ces cinq questions, le choix de PSU devient évident. Le prochain article de la série W (W05) couvre la gestion thermique et le flux d'air — l'autre moitié de la raison pour laquelle les configurations 4U à double alimentation nécessitent un acheminement soigné des câbles, et pourquoi le terme « ventilateur industriel » n'est pas un argument marketing.
Ceci fait partie du Kentino Wiki, une série de référence sur l'intelligence artificielle, la robotique et les systèmes qui les connectent. Commentaires et corrections bienvenus. info@kentino.com.