Quand un token devient travail, les gens deviennent l'interface
Auteur | Lin Wanwan
En 1876, lors de l'exposition universelle de Philadelphie, l'empereur brésilien Dom Pedro II a pris l'invention de Bell, le téléphone, entendu une voix à l'autre extrémité, et s'est exclamé : « Mon Dieu, ça parle ! »
Cent cinquante ans plus tard, le 18 mars 2026, au San Jose Convention Center, vêtue d'une veste en cuir noir, Jen-Hsun Huang se tenait sur la scène de la conférence GTC et a également prononcé une déclaration saisissante.
« Dans dix ans, NVIDIA comptera probablement environ 75 000 employés. Ils seront très, très occupés parce qu'ils travailleront avec 7,5 millions d'agents IA. »
Il y avait des rires dans le public.
75 000 personnes, 7,5 millions d'agents, 1 h 100.
Jen-Hsun Huang se gloussa et ajouta : « Ils travailleront 24 heures sur 24. Espérons que nos gens n'auront pas à rivaliser avec eux. »
Les applaudissements sont retombés, et ce nombre a été éclipsé ce jour-là par d'autres sorties de puces clinquantes et des annonces de partenariats. Mais si nous prenons un moment pour nous y attarder à nouveau, cela pourrait être l'une des déclarations les plus importantes de toute la conférence.
Il n'y a pas que Jen-Hsun Huang. Trois mois plus tôt, une autre personne décrivait le même avenir de façon plus concrète.
En janvier 2026, au CES de Las Vegas, Bob Sternfels, PDG de McKinsey, est monté sur scène et a présenté les numéros.
« Nous avons actuellement 40 000 employés humains et environ 25 000 agents d'IA. » Il y a moins de deux ans, ce nombre se chiffrait en milliers. Ces 25 000 agents ont généré 2,5 millions de graphiques au cours des six derniers mois.
2,5 millions de graphiques. Avant, c'était le travail d'analystes nouvellement embauchés. Vingt-trois ou vingt-quatre ans, se prélassant à la lueur d'une prestigieuse université, alignant les axes à trois heures du matin.
C'était le point de départ pour chaque nouvel arrivant de McKinsey, qui tradait le plus de main-d'œuvre mécanique contre un ticket pour la piste des partenaires.
Maintenant, la première moitié de ce ticket a été prise en charge par les agents. Selon M. Sternfels, « l'IA a entraîné une croissance de 25 % dans certaines positions et une réduction de 25 % dans d'autres. L'entreprise est parfaitement divisée en deux entre expansion et contraction. »
Les histoires de NVIDIA et McKinsey racontent la même histoire.
Dans un monde au 1/100, le travail est effectué par des agents pilotés par des tokens, et les gens sont des interfaces connectées à ces agents.
La télécommande de l’externalisation n’est pas entre vos mains
Pendant la semaine GTC, Jensen Huang est apparu dans le balado All-In et a livré une déclaration encore plus frappante.
« Supposons que vous ayez un ingénieur de 500 000 $ par année. S'ils n'ont pas consommé au moins 250 000 $ de tokens, je serais très inquiet. »
Lorsque l'hôte lui a demandé si NVIDIA dépensait 2 milliards de dollars en tokens pour l'équipe d'ingénieurs, Jensen Huang a répondu : « Nous y travaillons ».
Un ingénieur qui ne grave pas de tokens ne vaut même pas son salaire de 500 000 $.

L'approche de NVIDIA est très directe : envoyez des tokens dans le package de compensation. Jensen Huang a déclaré lors de la keynote du GTC qu'à l'avenir, chaque ingénieur NVIDIA disposera d'un budget annuel de tokens, soit environ la moitié de son salaire de base.
Pour un ingénieur dont le salaire de base est de plusieurs dizaines de milliers de dollars et qui reçoit une puissance de calcul supplémentaire équivalente à la moitié de son salaire de base, un tiers de son forfait total est du carburant pur.
Pour quelqu'un qui maximise son budget de tokens, c'est comme si une douzaine d'agents d'IA travaillaient 24 heures sur 24 pour l'aider à écrire du code, à effectuer des tests, à rechercher des documents et à effectuer des simulations. Quelqu'un qui n'a que la version gratuite d'un quota d'API compte encore sur ses propres mains pour taper sur le clavier. Deux personnes ayant un CV identique pourraient avoir une différence de productivité de 5 à 10 fois.
Ce n'est plus seulement une théorie dans la Silicon Valley.
En mars de cette année, Business Insider a rapporté un changement : les ingénieurs commencent à demander lors des interviews : « Combien de budget de tokens est alloué à ce poste ? » Tomasz Tunguz, associé chez Theory Ventures, a qualifié le budget Token de « quatrième pilier » de la rémunération des ingénieurs, après le salaire de base, les bonus et les fonds propres. Greg Brockman, le président d’OpenAI, l’a dit plus crûment : la quantité d’inférence à laquelle vous pouvez accéder déterminera de plus en plus votre productivité globale.
Dans son discours sur le GTC, Jensen Huang lui-même a déclaré : « Combien de tokens sont associés à mon rôle ? C'est déjà devenu un outil de recrutement dans la Silicon Valley. »
Dans les années 1950, les ouvriers de Detroit avaient certains des salaires les plus élevés des États-Unis. Ce qui leur a vraiment permis de vivre une vie de classe moyenne, c'est l'invention de la chaîne de montage par Henry Ford. Les travailleurs se tenaient sur la ligne, la ligne bougeait tandis que les gens restaient en place, et la production de chacun était amplifiée de nombreuses fois par des bras robotisés. Le niveau de vie d'un ouvrier de Detroit dépassait de beaucoup celui des artisans contemporains, dont le savoir-faire n'était peut-être pas supérieur, mais ils marchaient sur une chaîne de montage plus large.
Le budget de tokens 2026 est l'équivalent de la chaîne de montage de 1950.
Mais à une différence près.
À Detroit, les travailleurs pouvaient quitter Ford et aller chez GM, aller chez Chrysler, les chaînes de montage étaient partout. Les syndicats pourraient négocier avec la direction pour améliorer la vitesse des lignes et la sécurité des environnements.
Le budget de tokens est différent. Tu es un super-héros quand ils te le donnent, et redevient ordinaire quand ils le reprennent. Les actions peuvent être encaissées, les compétences peuvent vous suivre lorsque vous changez de travail. Le Budget Token n'est rien, juste un code de tricherie, avec le commutateur contrôlé par l'entreprise.
La Silicon Valley a déjà un mot pour cette situation, appelée "soif de processeur".
Les meilleurs chercheurs en IA changent de travail, l'écart salarial est maintenant le deuxième, avec la puissance de calcul en tête. Impossible de mener des expériences, de déployer des agents, les capacités sont limitées par des quotas. Le « Combien de tokens vous sont proposés » se classe parfois au-dessus des options d'achat d'actions. Les actions sont comme un contrôle futur qui pourrait baisser, le Budget Token est une productivité qui peut être encaissée aujourd'hui.
Et ceux qui n'ont pas d'IA sont juste éliminés.
Goldman Sachs estime que l'IA pourrait automatiser 25 % des heures de travail aux États-Unis. Un sondage Mercer indique que 65 % des dirigeants s'attendent à ce que deux à trois dixièmes de leurs effectifs soient réaffectés en raison de l'IA. Combinez les deux séries de chiffres, la conclusion est claire : les personnes avec des tokens explosent en sortie, celles sans tokens sont optimisées.
La ligne de démarcation est le quota de tokens, de moins en moins lié aux compétences d'une personne.
Le débit de tokens est une évaluation
La valeur personnelle est déterminée par le quota de tokens. Mais qu’en est-il des entreprises ?
Début mars 2026, une société basée à Shanghai, MiniMax, a publié son premier rapport annuel depuis son entrée en Bourse. Le chiffre d'affaires annuel s'est élevé à 79 M$, avec une perte nette ajustée de 250 M$. Selon les mesures financières traditionnelles, il s'agissait d'une petite entreprise qui consommait beaucoup d'espèces, dont le chiffre d'affaires ne représentait qu'une fraction des chiffres trimestriels d'Accenture.
Mais les marchés de capitaux voyaient les choses différemment.
Le PDG de MiniMax, Yan Junjie, a déclaré une phrase lors de l'appel de résultats, plus critique que l'ensemble du rapport : « La valeur de l'entreprise est déterminée par la densité de renseignement multipliée par le débit de tokens. »
Le Débit de Tokens, ni la croissance des revenus, ni le nombre d'utilisateurs, ni les marges brutes.
Les données à l'appui de cette affirmation sont très solides. En février 2026, la consommation quotidienne de tokens du modèle de la série M2 de MiniMax a été multipliée par six par rapport à il y a deux mois en décembre. La consommation de tokens dans un scénario de programmation a décuplé. Sur la plateforme d'agrégation de modèles IA OpenRouter, le M2.5 de MiniMax a consommé 45,5 billions de tokens en deux semaines, poussant tous les modèles américains vers la sortie et propulsant une entreprise basée à Shanghai au sommet du classement mondial de consommation de tokens pour la première fois.
La situation a été décrite par le South China Morning Post avec une déclaration : Le modèle open source chinois a mis fin à la domination des développeurs américains sur le marché depuis un an. Qu'est-ce qui a mené à la fin ? Consommation de tokens. Celui qui brûle le plus de tokens est le gagnant.
Cette logique s'applique également à OpenAI. La plateforme API d'OpenAI traite 6 milliards de tokens par minute, soit 20 fois plus en deux ans. Les entreprises clientes qui dépensent plus de 100 000 $ chaque année ont presque vu leur budget multiplié par 7. Ross Sandler, analyste chez Barclays, après avoir décortiqué les données, a conclu: La consommation de tokens du côté consommateur d'OpenAI est plus du double de celle de Google Gemini.
La consommation de tokens est devenue la devise forte pour classer les entreprises d'IA.
Encore plus intéressant est la façon dont cela se déroule en interne dans les entreprises. Un article récent du New York Times a fait état d'un phénomène appelé « tokenmaxxing » : Les ingénieurs Meta et OpenAI rivalisent dans les classements internes pour voir qui peut consommer le plus de tokens.
Le budget token devient un avantage standardisé, un peu comme les déjeuners gratuits et l'assurance dentaire d'il y a dix ans. Un ingénieur travaillant au bureau d'Ericsson à Stockholm a déclaré au New York Times que ses dépenses pour Claude pourraient être plus élevées que son salaire, mais l'entreprise paie la facture.
Un article récent sur TechCrunch a fait le calcul : Un ingénieur peut consommer 10 000 tokens en écrivant un article dans l'après-midi, mais un ingénieur exécutant un cluster d'agents peut détruire des millions de tokens en arrière-plan en une journée sans taper un seul mot.
Il y a deux ans, le prix par million de tokens était de 33 $. C'est 9 cents. C'est une baisse de 99,7%. Plus le prix est bas, plus la combustion est intense. Plus la combustion est intense, plus elle est difficile à détacher.
La prédiction de Yan Junjie sur la conférence téléphonique était la suivante : La demande future de tokens sur le marché peut augmenter d'un à deux ordres de grandeur.
C’est la nouvelle façon de valoriser les entreprises en 2026. Il ne s'agit pas de combien d'argent vous gagnez, mais de combien votre token a été détruit. MiniMax a essuyé un coup de 2,5 milliards, mais la forte courbe de croissance du débit de tokens a suffi à piquer l'intérêt des marchés de capitaux. On peut le voir comme YouTube en 2006, sans revenus mais avec une croissance exponentielle de la consommation de bande passante, ce qui a incité Google à dépenser 16,5 milliards pour l'acquérir.
À l'époque de YouTube, la bande passante était détruite. Aujourd'hui, MiniMax grave des tokens. L'unité de mesure a changé, mais la logique reste la même.
La capacité peut attendre, la dette ne peut pas
Quelque chose d'autre s'est passé la même semaine que GTC.
Le 18 mars, Stripe a lancé le protocole de paiement automatique. En termes simples : Les agents d'IA peuvent désormais dépenser de l'argent par eux-mêmes.
Un agent a besoin d'un jeu de données, il paie le téléchargement lui-même. Il a besoin de puissance de calcul pour l'inférence, il l'achète à la seconde. Il a besoin d'appeler l'API d'un autre mandataire, il règle la facture tout seul. L'ensemble du processus ne nécessite plus de confirmation humaine. Visa a adapté les paiements par carte de crédit pour ce protocole, Coinbase a créé des portefeuilles pour les agents et Mastercard développe Agent Pay.

La consommation de tokens a désormais une source supplémentaire. Auparavant, il n'y avait que le scénario d'« agent régulateur humain ». Maintenant, les agents eux-mêmes consomment des tokens et utilisent l'argent gagné grâce aux tokens pour acheter encore plus de tokens. Le cofondateur de Stripe, John Collison, a utilisé un terme: déluge.
Huang Renxun a fourni les numéros correspondants : NVIDIA prévoit d'augmenter le taux de génération de tokens de 22 à 700 millions, soit 350 fois plus.
Cela revient à construire tout un réseau autoroutier, en pariant que la fluidité du trafic va croître de façon exponentielle.
Un pari d'infrastructure de 6 000 milliards de dollars nécessite une hypothèse : la consommation mondiale de tokens doit être suffisamment importante pour supporter le ROI. Cette hypothèse n'est actuellement que cela, une hypothèse coûteuse.
Au dernier trimestre 2025, les entreprises technologiques ont émis un montant record de 108,7 milliards de dollars en obligations. Alors que nous entrons en 2026, les premières semaines ont vu 100 milliards de dollars en plus. Morgan Stanley et JPMorgan estiment que dans les années à venir, la dette totale des entreprises liées à l'IA pourrait atteindre 15 000 milliards de dollars. Selon Goldman Sachs, les dépenses en capital liées à l'IA représentent déjà environ 3 % du PIB américain. PIB.
Un groupe de Wall Streeters qui ont les premiers senti le risque a commencé à souscrire une assurance. Le volume des opérations de credit default swap est à la hausse. Payant une prime de quelques dizaines de points de base, ils font le pari que ces entreprises pourraient faire défaut sur leur dette. Daniel Sorid, responsable de la stratégie de crédit chez Citi, a déclaré lors d'une conférence avec les investisseurs : « En tant qu'investisseur de crédit, faire face à une transformation de cette ampleur qui nécessite un investissement en capital aussi important est intrinsèquement perturbant. »
Le cofondateur de Google, Larry Page, a dit un jour quelque chose de plus extrême au sein de l'entreprise, déclarant aux employés de Google à plusieurs reprises : « Je préfère faire faillite que de perdre cette course ».
Il décrit avec précision le dilemme d'un prisonnier : chaque géant parie que son adversaire continuera à investir, donc il ne peut pas s'arrêter non plus. Ceux qui arrêtent abandonnent directement.
Il y a un bon côté avec les données concrètes. Le taux de génération de tokens a été multiplié par 350. Stripe a laissé l'agent dépenser de l'argent tout seul. McKinsey est passé de quelques milliers d'agents à 25 000 en deux ans. Si l’économie des agents décolle complètement, la courbe de croissance de la consommation de tokens pourrait en effet devenir exponentielle.
Mais il y a un rendez-vous qui empêche beaucoup de gens de dormir la nuit. La falaise de renouvellement au second semestre 2026.
De 2024 à 2025, les entreprises dépensaient leur "budget innovation". Les PDG avaient besoin de dire « nous adoptons l'IA » lors de l'appel de gains, peu sensibles aux prix, peu exigeants en matière de résultats, dépensant de l'argent pour les apparences. Au second semestre 2026, la première vague de projets pilotes atteint le point de renouvellement. Le budget de l'innovation est épuisé, le directeur financier cède son siège de l'autre côté de la table et le directeur financier prend le relais. Le directeur financier ne reconnaît qu'un seul numéro : ROI.
Si un grand nombre de pilotes sont coupés, il y aura un écart soudain dans la consommation finale de tokens. La capacité de production en amont de 600 milliards de dollars, les data centers construits, le courant connecté, les puces sur les tablettes, se transformera en capacité inutilisée.
Une telle chose s'est produite dans l'histoire.
En 2000, les entreprises de télécommunications ont dépensé des milliers de milliards de dollars pour la pose de câbles sous-marins. Lorsque la bulle a éclaté, 90 % des câbles du monde sont restés sombres sous la mer, inactifs pendant près d'une décennie. Ce n'est que lorsque Netflix a commencé à diffuser, et que l'iPhone a déclenché l'Internet mobile, que les câbles se sont lentement allumés. Les câbles n'ont pas été posés en vain. Les constructeurs du câble, Lucent, Nortel et Tyco, ont tous fait faillite. L'infrastructure est restée, mais les constructeurs étaient partis.
En 2012, c'était l'industrie chinoise de l'énergie solaire. Shangde à Wuxi et Suntech dans le Jiangxi ont réduit les prix mondiaux des composants. Avec une offre de capacité sévèrement excédentaire, l'industrie a subi un bain de sang pendant trois ans. La demande est finalement venue plus tard, et aujourd'hui, l'énergie solaire est la source d'énergie qui connaît la plus forte croissance sur Terre. Shangde a fait faillite. Suntech a fait faillite. Les pionniers ont été laissés dans la dernière portion de l'obscurité avant l'aube.
Après l'invention du téléphone par Bell, Western Union a refusé d'acheter le brevet pour 100 000 $. Dix ans plus tard, Western Union était prête à offrir 25 millions de dollars, mais Bell a refusé de vendre. Trente ans plus tard, le réseau téléphonique couvrait l'ensemble des États-Unis. Cependant, la plupart des petites entreprises qui avaient construit le réseau n'ont pas vécu pour voir le jour où le téléphone s'est généralisé. Le gagnant était AT&T, qui a par la suite tout acquis et monopolisé.
L'histoire des infrastructures est toujours cette version. La direction est presque toujours correcte, mais le timing peut être mortel.
Revenons au token. Dans la structure mentionnée précédemment, le Token devient du travail, les gens deviennent des interfaces, l'allocation de tokens définit tout, avec le postulat que le Token est continuellement, massivement et rapidement consommé. La sortie 10x d'un ingénieur dépend de l'alimentation en tokens ; supprimez-le et il revient à zéro. L'estimation d'OpenAI, qui s'élève à 840 milliards de dollars, repose sur des engagements de puissance de calcul ; résilier le protocole, et il se réduit. Une infrastructure de 600 milliards de dollars repose sur la croissance de la consommation des utilisateurs finaux; si le taux de croissance ralentit, elle se transforme en une simple coquille.
Chaque couche repose sur la suivante. Si la croissance de la consommation accuse un retard de deux ou trois ans par rapport à celle de la construction, les prix pour tous dans toute la chaîne se desserreront.
Sur quel chemin de fer comptez-vous ?
En 2023, avoir une carte est roi. En 2026, avoir un token est roi.
Cela ressemble à un changement de mots, mais la transformation sous-jacente est plus profonde que la plupart des gens ne le pensent.
Le GPU est un atout ; une fois que vous l'achetez, il vous appartient, enfermé dans un centre de données où personne d'autre ne peut le prendre.
Le token, c'est du trafic. Votre production 10x, votre valorisation élevée, votre monnaie d'échange à la table de négociation, tout repose sur un approvisionnement continu et non détenu. Fermez le robinet et tout se remet à zéro.
Quand le Token devient vraiment le travail, les gens deviennent des interfaces attachées au Token. Une bonne interface peut améliorer la valeur du Token, et le jugement, l'esthétique et l'expérience sont toujours pertinents. Mais ce qu'une interface peut faire dépend principalement de la quantité de tokens à laquelle elle a accès.
Dans les années 1870, les fermiers américains découvrent que la culture du bon blé ne suffit pas ; elle doit être à côté du chemin de fer. Dans les années 1950, les artisans découvrent que, peu importe leur talent, ils ne peuvent pas rivaliser avec les ouvriers de la chaîne de montage. En 2026, les ingénieurs découvrent que, peu importe la beauté de leur code, sans allocation de tokens, tout n'est que rouets.
Quand le Token devient vraiment un travail, les gens deviennent des interfaces. Bien que la qualité de l'interface elle-même soit encore importante, la valeur de l'interface dépend principalement de la personne qui fournit sa puissance.
Vous pourriez aussi aimer

Diffusion du plan de table de l’IA | Rewire News Morning Brief

L'ère du « moment GPT » de l'IA incarnée approche-t-elle ? Axis Robotics annonce la fin des tests et le lancement sur Base Chain est prévu.

Méta mise à pied expliquée : Le même jour qu’ils ont licencié 700 personnes, ils ont distribué 90 milliards de dollars de bonus de fidélisation aux dirigeants

Le Bénin réprime les makers de marché, un procès attendu depuis longtemps

Collectif de Wall Street baissier en 2026, la crise pétrolière déclenchera-t-elle une récession ?

La nécromancie de l'IA à Hollywood : La mort n'est plus la fin du travail

a16z : La DeFi peine à soutenir un véritable marché financier

Infos du matin | Bitmine lance sa plateforme institutionnelle de staking Ethereum MAVAN ; Franklin Templeton lance un ETF tokenisé ; Morgan Stanley va émettre et sponsoriser un ETF Bitcoin

Premiers employés de Kalshi : Celui qui contrôle le trafic contrôle le marché

Fier de vous présenter Aethir Claw : Votre agent IA, notre infrastructure

Pourquoi acheter de l'or peut mener à la faillite

Si le rendement du Trésor américain dépasse 5 %, le Bitcoin tombera-t-il en dessous de 50 000 $ ?

Circle s'effondre de 20 % : Un séisme sur le marché des cryptomonnaies provoqué par un projet de proposition

Après la fin des hostilités : 5 fins possibles au conflit au Moyen-Orient

Fin des rendements sur les stablecoins : Circle s'effondre de 20 % en une journée

L'IA connectée à la machine de guerre | Rewire News Nightly

Web3 est incroyable, mais le remède n'est pas l'IA

