Une équipe de chercheurs de l'institut de recherche à but non lucratif Epoch AI utilise des sources d'informations ouvertes pour cartographier la croissance des centres de données américains. L'équipe examine minutieusement des images satellites, des permis de construire et d'autres documents juridiques locaux afin de dresser une carte des immenses bâtiments remplis d'ordinateurs qui poussent comme des champignons à travers les États-Unis. Elle transforme ensuite ces données en une carte interactive qui répertorie leurs coûts, leur puissance et leurs propriétaires.Les projets de construction de centres de données à grande échelle constituent un secteur en pleine croissance et controversé aux États-Unis. La Silicon Valley et l'administration Trump misent l'ensemble de l'économie américaine sur la croissance continue de l'IA, une mission qui nécessitera des milliards de dollars d'investissements dans des centres de données et de nouvelles infrastructures énergétiques. Les cartes d'Epoch AI constituent une base de données centrale sur ces bâtiments bruyants et gourmands en eau qui se multiplient dans nos communautés.
Contexte
L’économie numérique américaine repose sur une réalité matérielle souvent ignorée : des milliers de centres de données disséminés sur le territoire, parfois bien identifiés, parfois presque invisibles. Depuis quelques mois, une nouvelle génération de chercheurs, d’analystes et de journalistes d’investigation s’emploie à cartographier cette infrastructure cachée. Leur objectif est clair : comprendre où se trouvent réellement les data centers, quelle est leur capacité énergétique, et ce que leur prolifération dit de l’industrialisation accélérée de l’intelligence artificielle et du cloud.
Cette chasse aux data centers dissimulés n’a rien d’anecdotique. Elle révèle les angles morts de la planification énergétique, les failles de la transparence industrielle et l’ampleur réelle des investissements consentis pour soutenir l’IA à grande échelle.
Une infrastructure critique devenue difficile à localiser
Pendant longtemps, les centres de données étaient relativement simples à identifier. Ils prenaient la forme de vastes bâtiments clairement signalés, souvent implantés dans des zones industrielles ou à proximité de nœuds énergétiques stratégiques. Cette visibilité a progressivement disparu. Aujourd’hui, une partie croissante des data centers se fond dans le paysage : anciens entrepôts reconvertis, bâtiments sans enseigne, installations modulaires dissimulées derrière des structures logistiques classiques.
Cette évolution n’est pas fortuite. La montée en puissance du cloud distribué, des architectures edge et des besoins spécifiques de l’IA a favorisé des implantations plus petites, plus nombreuses et parfois volontairement discrètes. Pour les acteurs du secteur, cette opacité offre une flexibilité opérationnelle et réduit les frictions locales, notamment en matière d’urbanisme ou d’acceptabilité sociale.
Pour les chercheurs, elle pose un problème majeur : comment mesurer l’empreinte réelle du numérique si l’on ne sait pas précisément où se trouvent les infrastructures qui le rendent possible ?
La donnée comme outil de traque industrielle
Face à cette invisibilité croissante, certains projets de recherche ont adopté une approche radicalement différente. Plutôt que de se limiter aux déclarations officielles des opérateurs ou aux permis de construire, ils croisent des jeux de données hétérogènes : consommation électrique anormale, proximité de sous-stations, images satellites, permis environnementaux, réseaux de fibre optique, voire traces laissées par les appels d’offres publics.
Des initiatives comme celles menées par Epoch AI illustrent cette nouvelle méthodologie. En agrégeant des sources ouvertes et des données techniques, ces chercheurs tentent de dresser une cartographie plus réaliste du parc de data centers américains, incluant ceux qui n’apparaissent dans aucune communication officielle.
Ce travail révèle une réalité troublante : le nombre de centres de données, notamment dédiés à l’IA et à l’entraînement de modèles, est très probablement sous-estimé dans les statistiques publiques.
L'illustration d'un travail de recherche
Sur la carte d'Epoch, un cercle vert surplombe New Albany, dans l'Ohio. En cliquant dessus, vous accéderez à une vue satellite du complexe où Meta construit son centre de données «*Prometheus*». Selon Epoch, le coût total de construction s'élève à ce jour à 18 milliards de dollars et la consommation électrique est de 691 mégawatts.
«*Combinant tentes résistantes aux intempéries, installations de colocation et bâtiments traditionnels de Meta, ce centre de données illustre la réorientation de l'entreprise vers l'IA*», indique Epoch dans sa documentation. «*Pour refléter cette structure hétérogène, notre analyse s'appuie sur une combinaison de cartes d'occupation des sols, d'autorisations relatives aux turbines à gaz naturel et d'images satellite/aériennes des équipements de refroidissement afin d'estimer la capacité de calcul.» Les utilisateurs peuvent même consulter une chronologie de la construction et observer l'évolution des images satellite au fur et à mesure de l'expansion du centre de données.
«*On parle beaucoup, publiquement et entre chercheurs, de l'avenir de l'IA*», a déclaré Jean-Stanislas Denain, chercheur principal chez Epoch AIia. «*Les initiés ont accès à de nombreuses données confidentielles, mais ce n'est pas le cas du grand public. C'est pourquoi l'existence de cette ressource en ligne est si précieuse.»
Revenez à une vue d'ensemble du pays et cliquez sur un cercle à Memphis, dans le Tennessee, pour en savoir plus sur Colossus 2 de xAI. «*Pour alimenter le centre de données, xAI a fait le choix inhabituel d'installer des turbines à gaz naturel de l'autre côté de la frontière, dans le Mississippi, probablement pour obtenir plus rapidement les autorisations nécessaires à leur exploitation*», a indiqué Epoch AI. «*L'installation de batteries semble terminée (même si d'autres pourraient être ajoutées). Les turbines semblent connectées, et les travaux de construction autour sont minimes. Sur la base de ces informations et de tweets antérieurs d'Elon Musk, 110*000 GPU NVIDIA GB200 sont opérationnels.*»
Les informations concernant les centres de données sont incomplètes
Il est impossible de connaître précisément le coût total et le fonctionnement de ces infrastructures. La législation locale et nationale étant variable, toutes les informations relatives à la construction ne sont pas publiques, et l'imagerie satellite ne permet qu'une vision partielle de la situation sur le terrain. La carte d'Epoch AI ne recense probablement qu'une fraction des centres de données mondiaux. « En novembre 2025, ce sous-ensemble représentait environ 15 % de la puissance de calcul IA fournie par les fabricants de puces à l'échelle mondiale », explique Epoch AI sur son site web. « Nous étendons nos recherches afin de localiser les plus grands centres de données au monde, en utilisant l'imagerie satellite et d'autres sources de données. »
La section méthodologie du site explique la démarche d'Epoch AI et présente des photographies en accéléré illustrant la croissance de ces gigantesques centres de données. Parmi les principaux indices visuels analysés sur les images satellite, on retrouve les systèmes de refroidissement. « Les centres de données modernes dédiés à l'IA génèrent tellement de chaleur que les systèmes de refroidissement s'étendent à l'extérieur des bâtiments, généralement autour de ceux-ci ou sur le toit. L'imagerie satellite nous permet d'identifier le type de refroidissement, le nombre d'unités de refroidissement et (le cas échéant) le nombre de ventilateurs sur chaque unité », a-t-on indiqué.
« Nous nous concentrons sur le refroidissement car c'est un indice précieux pour déterminer la consommation d'énergie », explique Denain. « Nous cherchons d'abord à estimer la consommation, mais souvent, nous manquons d'informations à ce sujet… puis nous pouvons relier la consommation à la puissance de calcul et au coût de construction. Le refroidissement est donc un indicateur très utile pour estimer la consommation. »
Après avoir compté les ventilateurs, l'équipe d'Epoch intègre ces données dans un modèle qu'elle a conçu pour estimer la consommation énergétique d'un centre de données. « Ce modèle repose sur le type de refroidissement et des caractéristiques physiques telles que le nombre et le diamètre des ventilateurs, ainsi que la surface au sol occupée par l'ensemble du système de refroidissement », explique Epoch AI sur son site web. « Le modèle de refroidissement présente encore une marge d'incertitude importante. Les données techniques suggèrent que la capacité de refroidissement réelle peut être jusqu'à deux fois supérieure ou inférieure aux estimations de notre modèle, selon la vitesse de ventilation choisie. »
Pourquoi cacher un data center ?
La question centrale n’est pas seulement de savoir où sont ces infrastructures, mais pourquoi elles échappent à la visibilité. Les raisons sont multiples et souvent pragmatiques. D’abord, la concurrence. Dans un contexte où la capacité de calcul est devenue un avantage stratégique,...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.