Types d'unités de distribution d'alimentation (PDU) pour baies de serveurs d'IA : basique, mesurée, commutée, ATS

L'unité de distribution électrique (PDU) est l'élément le plus ennuyeux du rack et celui qu'on regrette le plus vite. Un serveur d'IA à 4 GPU consomme entre 1.8 et 2.4 kW en continu ; un nœud à 8 GPU, entre 3.5 et 4.5 kW. À ces niveaux de consommation, la PDU n'est plus simplement « le dispositif auquel le serveur se branche » : elle fait office de manomètre, de schéma des disjoncteurs, de bouton de réinitialisation à distance et, en cas de problème, de seul indicateur permettant de savoir quelle prise est en train de surchauffer.

Cet article passe en revue l'ensemble des PDU, de la simple multiprise à l'unité intelligente à double alimentation, en présentant une tarification transparente, les fonctionnalités offertes par chaque niveau et les points d'inflexion du rapport coût/bénéfice pour le calcul IA. Indépendant des marques.

Les niveaux, dans un tableau

Niveau Ce qu'il fait Visibilité par point de vente Contrôle à distance Prix ​​UE, 24 prises 0U
Fonction Plug & Play Multiprise en rack Aucun Non 80-150 €
Mesuré (entrée) Affichage du courant/tension agrégé Aucun Non 350-500 €
Compteur de sortie Courant/tension/puissance par prise Oui Non 700-1200 €
Commuté Compteur cumulatif + prise de courant à distance marche/arrêt Aucun Oui 900-1400 €
Interrupteur + compteur de prise Le tableau complet Oui Oui 1500-3000 €
variante ATS (double entrée) Basculement entre deux sources Par niveau supérieur Par niveau supérieur +400 à 800 € en plus

La solution optimale pour tout rack d'IA comportant deux nœuds de calcul ou plus est un système de commutation avec mesure des prises. Nous le démontrerons ci-dessous.

PDU de base — la bande passive

Multiprise rackable. Phase, neutre, terre, une rangée de prises, parfois un disjoncteur par groupe. Sans écran, sans port réseau, sans circuit logique. Une seule entrée (prise C20 ou prise câblée), six à vingt-quatre prises de type C13 et C19, et éventuellement une LED d'alimentation.

Vous n'aurez pas accès à la consommation électrique de chaque prise, ni à celle de l'appareil lui-même. Impossible de redémarrer l'appareil à distance. Aucune intégration de surveillance n'est disponible. Si le serveur tombe en panne et que vous vous trouvez à 200 km, vous devrez appeler quelqu'un qui possède la clé de la baie.

L'offre de base convient parfaitement à une paillasse de laboratoire sous votre bureau, ou à un seul nœud de développement dans un petit bureau où vous pouvez facilement accéder à la prise. Elle est inadaptée à tout serveur d'IA en production, à toute baie inaccessible en moins de 30 minutes, et à toute baie comportant plus de deux nœuds de calcul. L'écart de prix entre l'offre de base (100 €) et l'offre à la consommation (400 €) est faible pour un seul GPU ; optez au minimum pour l'offre à la consommation.

PDU mesuré — visibilité globale, sans détail par prise

Un PDU avec mesure ajoute un affichage local indiquant le courant d'entrée, la tension et généralement la puissance (kW) et l'énergie (kWh). Sur les unités triphasées, il affiche les valeurs par phase. Les unités plus performantes exposent ces mêmes données via SNMP, Modbus TCP ou HTTP.

Ce qui vous manque encore : le courant par prise. Vous voyez que le rack consomme 18 A. Vous ne voyez pas si la prise 4 consomme 9 A et la prise 5 0.5 A, ni si les deux consomment 4.75 A. Pour un rack d’IA hétérogène, c’est pourtant crucial. De plus, vous n’avez aucun contrôle sur les prises : elles sont toujours alimentées tant que l’appareil est sous tension.

Ce niveau de service est idéal pour une baie mono-locataire avec un ou deux serveurs GPU et un commutateur, où la charge est prévisible et où l'on se contente de surveiller la limite de consommation. Optez plutôt pour une facturation par prise si vous avez plus de deux nœuds GPU, des obligations de refacturation ou un profil de charge qui varie fortement entre l'entraînement et l'inférence sur la même prise.

PDU avec mesure par prise — mesure par prise, référence de l'IA

Mesure du courant, de la tension, de la puissance et de l'énergie par prise. Un petit transformateur de courant ou shunt est installé sur chaque prise, avec des relevés effectués plusieurs fois par seconde. L'accès aux protocoles SNMP/Modbus/HTTP est identique à celui des compteurs traditionnels, avec des OID par prise.

Pour le calcul IA, ce niveau est le premier à fournir les données essentielles. Vous pouvez ainsi identifier la consommation de chaque serveur GPU : lorsqu'une session d'entraînement est lancée et que la consommation du rack passe de 24 A à 30 A, vous savez immédiatement que c'est le nœud composé de 8 GPU 5090 qui est en cause. La mesure du facteur de puissance par prise permet de détecter une alimentation vieillissante ou sous-dimensionnée avant toute panne. Les accumulateurs de kWh par prise garantissent une facturation précise. Les alarmes par prise (par exemple, 12 A sur une prise C13, soit 80 % de sa capacité) détectent les variations de consommation avant le déclenchement du disjoncteur principal.

Ce que vous ne pouvez toujours pas faire : redémarrer à distance un serveur bloqué. La prise est équipée d’un compteur, mais elle est toujours alimentée.

Les unités avec compteur intégré coûtent entre 700 et 1 200 €, soit entre les modèles avec compteur intégré (400 €) et ceux avec compteur commuté (plus de 1 500 €). Si vous êtes certain de ne jamais avoir besoin de la commande à distance des prises, ce prix est justifié. En pratique, la plupart des racks d'automatisation industrielle nécessitent les deux options.

PDU commuté — commande de prise à distance

Un PDU commuté ajoute un relais (mécanique ou statique) derrière chaque prise. Vous pouvez activer, désactiver ou faire alterner une prise (désactivée pendant N secondes, puis activée) via HTTP, SNMP ou l'application du fournisseur. La mesure agrégée est identique à celle d'un PDU individuel ; il n'y a pas de mesure par prise.

La fonctionnalité phare est le redémarrage sans intervention humaine. Il arrive fréquemment qu'une tâche d'entraînement d'IA bloque un serveur au point de rendre l'IPMI inopérant. Le bloc d'alimentation commuté est le dernier recours pour redémarrer le serveur sans intervention humaine. Autres utilisations : séquencement de démarrage programmable après une coupure d'onduleur (afin d'éviter le démarrage simultané de tous les serveurs) et programmation de la mise en marche et de l'arrêt des équipements de laboratoire.

Sans l'option de mesure au niveau de la prise, vous ne pouvez pas vérifier si la prise est effectivement alimentée après sa mise en marche. Le PDU indique que le relais est fermé, mais pas que le serveur consomme du courant. Pour un redémarrage à distance fiable, il est indispensable de connaître ces deux états.

Interrupteur et compteur de prise : le point d’équilibre idéal pour les opérations par IA

Mesure et contrôle à distance par prise, le tout dans un seul appareil. C'est la solution idéale pour tout rack IA de production.

  1. Consommation par prise dans votre pile de surveillance Outre la consommation du GPU, la température ambiante et les rails d'alimentation, les anomalies apparaissent sur un tableau de bord unique.
  2. Redémarrage à distance en boucle fermée. Coupez le relais, observez le courant tomber à zéro, attendez cinq secondes, remettez le relais en marche, observez le courant revenir à sa valeur de ralenti attendue.
  3. Alerte thermique précoce. Si la prise 4 commence à consommer 2.6 kW alors qu'elle fonctionne normalement à 1.7 kW au repos, l'alarme se déclenche avant que le climatiseur de la pièce ne s'arrête.
  4. véritable remboursement avec kWh horodatés NTP par prise.

Coût : 1 500 à 3 000 € pour un rack vertical 0U à 24 prises. C’est moins cher qu’une seule RTX 5090. Dans un rack hébergeant plus de 30 000 € de GPU, il est essentiel de ne pas lésiner sur ce poste de dépense.

Si vous ne pouvez pas accéder physiquement au rack (colocation, bureau distant, bâtiment à accès restreint), vous DEVEZ changer de système. Un seul déplacement évité en dehors des heures ouvrables compense largement la différence.

ATS PDU — basculement entre deux sources d'alimentation

Un PDU ATS (commutateur de transfert automatique) possède deux cordons d'alimentation provenant de deux sources différentes et alimente une seule rangée de prises à partir de l'entrée fonctionnelle. En cas de baisse ou de coupure de tension sur l'entrée principale, l'ATS bascule sur l'entrée secondaire en 8 à 16 ms. Les équipements situés en aval ne subissent qu'une brève perturbation.

Les PDU ATS sont destinés aux équipements à alimentation unique nécessitant une redondance de source. Les serveurs modernes à double alimentation n'ont pas besoin d'ATS : chaque alimentation est branchée sur un PDU distinct, lui-même connecté à une source différente, et le serveur gère nativement le basculement. L'ATS est indispensable lorsque la baie contient des équipements à alimentation unique (la plupart des commutateurs réseau, KVM, petits périphériques de stockage) et qu'une panne de source est inacceptable.

Un système ATS ne fournit pas de batterie de secours ; en cas de défaillance des deux sources d'alimentation, il est également hors service. Il est donc toujours recommandé d'installer un onduleur en amont d'au moins une source. De plus, il ne protège pas contre les courts-circuits en aval : une prise défectueuse provoque systématiquement le déclenchement du disjoncteur.

Idéal pour une baie mixte comprenant des serveurs à double alimentation et des équipements à alimentation simple. Surdimensionné pour une baie entièrement équipée de double alimentation (deux PDU indépendants suffisent) ou pour un laboratoire où une brève coupure est certes gênante, mais pas catastrophique.

Distribution triphasée de PDU

Dès qu'une baie dépasse environ 5 kW en continu, l'alimentation monophasée de 16 A (3.7 kW) est insuffisante et celle de 32 A (7.4 kW) devient limite. La solution standard consiste en un bloc d'alimentation triphasé (PDU) sur une prise IEC 60309 32 A 3P+N+T (rouge, 400 V entre phases / 230 V entre phase et neutre).

P_max = √3 × V_LL × I × PF
      = 1.732 × 400 V × 32 A × 1.0
      ≈ 22.2 kVA  (about 22 kW at unity PF)

La norme européenne réduit la puissance nominale en charge continue à 80 % du disjoncteur, ce qui ramène la puissance utile soutenue à environ 17-18 kW. De quoi alimenter sans problème quatre nœuds à 4 GPU et le réseau.

En interne, les trois phases (L1, L2, L3) sont réparties sur les sorties de deux manières différentes. Phase par groupe (les prises 1 à 8 sur L1, 9 à 16 sur L2, 17 à 24 sur L3) est simple mais risque de créer un déséquilibre si tout votre équipement à charge élevée atterrit sur le même groupe. Rayé en phase (Les prises 1/4/7 sur L1, 2/5/8 sur L2 et 3/6/9 sur L3) placent les prises adjacentes sur des phases différentes, de sorte que les serveurs montés de manière contiguë soient naturellement répartis entre les phases. La plupart des PDU intelligents modernes sont configurés par défaut pour ce type de répartition.

Exemple de câblage fonctionnel pour une unité de distribution d'alimentation triphasée de 32 A alimentant un rack d'IA à 4 nœuds :

Input: IEC 60309 32A 3P+N+E (red, 400/230V)
       L1 — 32A   L2 — 32A   L3 — 32A   N   PE

Internal: per-phase 32A hydraulic-magnetic breaker
          per-outlet relay + CT (switched + outlet-metered)
          phase-striped outlets

Outlets (24 total, 12× C19 + 12× C13, 0U vertical):

  1  (L1, C19)  Node A PSU-1   (8× 5090,  ~4.0 kW)
  2  (L2, C19)  Node A PSU-2   (same node, split delivery)
  3  (L3, C19)  Node B PSU-1   (4× Pro 6000, ~2.2 kW)
  4  (L1, C19)  Node B PSU-2
  5  (L2, C19)  Node C PSU-1   (4× 5090, ~2.0 kW)
  6  (L3, C19)  Node C PSU-2
  7  (L1, C19)  Node D PSU-1   (4× 5090, ~2.0 kW)
  8  (L2, C19)  Node D PSU-2
  9  (L3, C13)  ToR switch (~80 W)
  10 (L1, C13)  Mgmt switch (~30 W)
  11 (L2, C13)  KVM-over-IP (~20 W)
  12 (L3, C13)  Head/jump host (~150 W)
  13–24         Reserve / aux

Per-phase load (all nodes at ~80% sustained):
  L1 ≈ 4.1 kW / 17.8 A
  L2 ≈ 4.0 kW / 17.4 A
  L3 ≈ 2.4 kW / 10.4 A

Deux éléments sont importants ici. Premièrement, le découpage en phases assure la majeure partie de l'équilibrage automatiquement. Deuxièmement, les nœuds de distribution à double alimentation connectent intentionnellement leurs deux câbles à des phases différentes. Pour tout serveur d'IA doté de deux alimentations en configuration split-dialecte, branchez chaque alimentation sur une phase différente. — Réduit de moitié le courant par phase, améliorant ainsi la marge de puissance. (« Distribution divisée » est le terme utilisé dans notre documentation produit : deux alimentations supportant chacune la moitié de la charge, et non une redondance 1+1. Voir W04 pour plus de détails.)

Le déséquilibre L3 dans l'exemple (environ 14 A delta) est à la limite de ce que les services publics acceptent avec grâce. P03 couvre l'équilibrage de phase entre les racks au niveau du bâtiment.

C13, C14, C19, C20 — types de prises

connecteur Note Là où vous le voyez
C13 10A/250V Serveurs ≤ 1.5 kW, commutateurs, KVM
C14 10A/250V Prise d'entrée sur l'appareil pour une prise C13
C19 16A/250V Nœuds d'IA à courant élevé, alimentations de grande taille
C20 16A/250V Prise d'entrée sur l'appareil pour une prise C19

Les extrémités paires sont des entrées pour appareils, les extrémités impaires sont des prises pour cordons/PDU.

Le point pertinent : Tout ce qui dépasse environ 1.5 kW en continu nécessite C19/C20, et non C13/C14. Un nœud d'IA à 4 GPU alimenté par une alimentation de 2000 à 2400 W dépasse la norme C13. Tenter de l'alimenter via une alimentation C13, c'est s'exposer à la fonte du connecteur quatre mois après son déploiement, la résistance de contact ayant augmenté sous l'effet des cycles thermiques.

Un bloc d'alimentation (PDU) pour rack IA correctement spécifié comporte de nombreuses prises C19, et non seulement deux ou trois. Une configuration optimale pour un rack vertical 0U à 24 prises est de 12 prises C19 et 12 prises C13. Certains fournisseurs proposent des prises « combinées » acceptant les C14 et C20 dans le même connecteur ; cela fonctionne, mais coûte plus cher. Commandez des câbles adaptateurs C19-C20 compatibles (0.9 à 1.2 m pour les PDU 0U montés à l'arrière du rack). Prévoyez-en trois ou quatre de rechange : on a vite fait de les perdre.

Calibre de l'unité de distribution d'alimentation (PDU) par rapport au calibre du circuit

Utility / panel breaker:     32 A 3-phase (C-curve)
Continuous load (80% rule):  25.6 A per phase usable
PDU rating:                  32 A per phase
Per-phase outlet sum target: ≤ 25 A

Le PDU supportera sans problème 32 A par phase. Le disjoncteur en amont finira par se déclencher en cas de courant soutenu de 30 A ; les disjoncteurs thermomagnétiques absorbent les surcharges sur plusieurs minutes. Prévoyez une marge de 80 % pour les courants d'appel et les pics de tension brefs. Les disjoncteurs intégrés au PDU constituent la deuxième couche de protection.

SNMP, Modbus, HTTP — extraction des données

Un PDU commuté et équipé d'un compteur de prise vaut ce que votre système de surveillance peut en détecter.

  • SNMP v2c / v3 — la réponse universelle. Tout éditeur sérieux publie un MIB ; Prometheus snmp_exporter Il collecte les données. Utilisez la version 3 lorsqu'elle est prise en charge, et la version 2c sur un VLAN de gestion lorsque cela est nécessaire. Interrogez toutes les 30 secondes en temps normal, et toutes les 10 secondes pour une détection rapide des anomalies.
  • Modbus TCP — Fréquemment utilisé par les marques à vocation industrielle. Moins standardisé que SNMP (les correspondances de registres varient), mais fiable. Prometheus propose des exportateurs Modbus.
  • REST HTTP / JSON — Les PDU intelligents modernes sont dotés d'une API REST. Plus facile pour les intégrations personnalisées ; moins courant que le protocole SNMP.
  • Applications cloud du fournisseur — Utile pour une vue d'ensemble, mais ne pas utiliser pour le suivi de la production.
PDU
Données SNMP v3 par prise
SNMP
exportateur SNMP
Traduction MIB
Prométhée
  • Tableaux de bord Grafana
  • Alertmanager → Slack / PagerDuty
Seuils d'alerte
Métrique Seuil de porte
Courant d'entrée par phase Avertir 70 % du disjoncteur, page 85 %
Puissance active par prise Alerte en cas d'écart de plus de 30 % par rapport à la moyenne mobile sur 1 heure
Puissance totale en kWh Pas d'alarme, graphique pour le remboursement
Température interne du PDU Avertissement 50 °C, page 60 °C
État du relais de prise par rapport à la commande Page sur l'incompatibilité
Accessibilité SNMP Page après 3 min d'inaccessibilité

La vérification de l'état du relais par rapport à la commande est souvent négligée. Un relais commandé peut rester bloqué en position fermée (plus fréquent qu'en position ouverte). Vous avez commandé la coupure de la prise 5, mais le courant circule toujours : le relais est bloqué et vous ne pouvez pas réinitialiser le serveur. Vous voulez savoir pourquoi.

Le point de vue honnête

Pour toute baie de serveurs IA comportant au moins deux nœuds de calcul, optez pour une alimentation triphasée avec disjoncteur et compteur individuel. Utilisez une alimentation triphasée si la charge continue dépasse 5 kW et si le bâtiment est alimenté en triphasé. L'option ATS est requise uniquement si votre baie ne contient pas d'équipements redondants et est alimentée par deux sources.

Les raisons de passer à une configuration inférieure sont limitées : un seul nœud sur une paillasse de laboratoire, facilement accessible, suffit ; un ou deux nœuds dans vos locaux, avec un budget serré, peuvent se contenter d’une consommation mesurée. Pour les calculs d’IA en production, inaccessibles en moins de 15 minutes, une configuration commutée et avec consommation mesurée est indispensable, sans exception.

L'erreur consiste à acheter une alimentation de base ou à la consommation pour économiser 1 000 € sur un rack contenant plus de 30 000 € de GPU. Dès la première panne de 4 heures due à l'impossibilité de redémarrer un nœud bloqué à distance, la mise à niveau de l'unité de distribution d'alimentation (PDU) est vite rentabilisée.

Qu'est-ce qui casse ?

Modes de défaillance des PDU que nous avons observés, par ordre de fréquence approximatif :

  • Relais soudé sur unités commutées. Prise coupée, courant toujours présent. Alarme : incohérence entre l’état du relais et la consigne. Remplacez l’appareil ; les relais ne se réparent pas.
  • Dérive du dosage à la sortie. Les transformateurs de courant bon marché présentent une dérive de 5 à 10 % après deux ou trois ans. Si la facturation dépend de cette dérive, il est conseillé de les recalibrer annuellement ou d'acheter des appareils dont la précision est garantie à vie (les appareils de qualité annoncent une précision de ±1 %).
  • Blocage du contrôleur. Le système de mesure et de contrôle se bloque ; l’alimentation des prises est maintenue, mais la connexion SNMP est interrompue. La plupart des appareils sont équipés d’un dispositif de surveillance qui redémarre le contrôleur sans couper l’alimentation des prises ; vérifiez que le vôtre en est doté.
  • Panne thermique à sortie unique. Le C13 en particulier subit une augmentation de la résistance de contact sous un courant soutenu de 8 à 10 A. Mesure d'atténuation : utiliser du C19 au-dessus de 1.5 kW, effectuer un balayage IR d'un rack lourd tous les trimestres.
  • Déséquilibre de phase progressif. L'installation du rack est équilibrée ; six mois plus tard, un équipement a été ajouté sur une phase. Les alarmes par phase et les contrôles trimestriels le détectent.
  • La mise à jour du firmware rend la manette inutilisable. Traitez les mises à jour du firmware comme toute modification de production : fenêtre de maintenance, unité secondaire en premier, plan de restauration prêt.

Que faire ensuite

Si vous configurez un rack pour le calcul IA :

  1. Calculer la charge soutenue. Additionnez la consommation électrique typique de chaque serveur, et non celle indiquée sur sa plaque signalétique. Nœud K-AI 4 GPU : prévoir 2.0 à 2.4 kW ; 8 GPU : 3.5 à 4.5 kW. Prévoyez 10 % pour le réseau et le BMC.
  2. Monophasé contre triphasé. En dessous de 5 kW en continu, un courant monophasé de 32 A suffit. Au-delà, un courant triphasé de 32 A est nécessaire. À partir de 17-18 kW, il faut un courant triphasé de 63 A et une discussion sérieuse avec un électricien s'impose.
  3. Choisissez le niveau. Alimentation par défaut commutée + compteur de prise. Ne pas réduire la tension uniquement en cas de raison valable.
  4. Choisissez les connecteurs. Comptez les entrées C19/C20 sur les serveurs réels ; procurez-vous une PDU avec au moins autant de prises C19 plus C13 pour l'équipement réseau, plus des pièces de rechange.
  5. Planifiez le suivi. SNMP v3 si pris en charge ; snmp_exporter dans Prometheus ; créez le tableau de bord avant d’en avoir besoin.
  6. Pour les flux à double source : Déterminez quel équipement est à double alimentation (deux PDU distincts) ou à alimentation simple (PDU ATS alimenté par les deux). N'utilisez pas plusieurs configurations différentes sur un même équipement.
  7. Commander des câbles C19/C20 de rechange. Trois ou quatre. Croyez-nous.

P03 assure l'équilibrage de phase sur plusieurs racks. P04 Il couvre le dimensionnement des disjoncteurs et le courant d'appel. P05 dimensionner l'onduleur en amont du PDU.


Ceci fait partie du Kentino Wiki, une série de référence sur l'intelligence artificielle, la robotique et les systèmes qui les connectent. Commentaires et corrections bienvenus. info@kentino.com.