Dernière interview du cofondateur d'OpenAI : quel avenir pour ChatGPT après l'arrêt de Sora ?
Titre de la vidéo : Greg Brockman, président d'OpenAI : stratégie IA, AGI et « Super App »
Auteur de la vidéo : Alex Kantrowitz
Traduction : Peggy, BlockBeats
Note de la rédaction : Cet article est traduit d'une conversation avec Greg Brockman, président et cofondateur d'OpenAI, dans le podcast Big Technology. L'émission se concentre depuis longtemps sur les évolutions de l'IA, l'industrie technologique et la structure des entreprises, offrant une fenêtre importante sur les observations de première ligne dans la Silicon Valley.

Dans cette conversation, Brockman ne s'attarde pas sur les capacités du modèle lui-même, mais pousse la réflexion plus loin : alors que les capacités de l'IA sont largement validées, comment l'industrie choisira-t-elle sa voie, remodelera-t-elle ses produits et absorbera-t-elle l'impact systémique qui en découle ? La discussion porte sur la stratégie produit d'OpenAI, la future « Super App » et son analyse de l'IA entrant dans sa « phase de décollage ».
Cette conversation peut être comprise sous trois angles.
Premièrement, la convergence des trajectoires.
De la génération vidéo aux modèles d'inférence, d'une progression sur plusieurs fronts à des choix actifs, les décisions d'OpenAI ne relèvent pas d'un simple jugement de supériorité technique, mais d'une réponse aux contraintes du monde réel : la puissance de calcul est devenue un goulot d'étranglement majeur. Avec des ressources limitées, la feuille de route technique commence à converger vers deux directions à fort levier : les assistants personnels et la résolution de problèmes complexes. Cela signifie également que la logique concurrentielle de l'IA passe de « ce qui peut être fait » à « ce qu'il faut faire en priorité ».
Deuxièmement, la reconstruction des formes.
La proposition de la « Super App » constitue fondamentalement un saut dans la forme du produit. L'IA n'est plus une collection d'outils dispersés, mais un point d'entrée unifié : elle comprend le contexte, utilise des outils, exécute des tâches et accumule continuellement de la mémoire dans différents scénarios. De ChatGPT à Codex, l'IA prend progressivement en charge des flux de travail entiers, et le rôle humain passe de l'exécutant au planificateur : définir des objectifs, assigner des tâches et superviser.
Troisièmement, l'inflexion du rythme.
Si les deux dernières années ont été une phase d'ascension des capacités, ce qui se produit maintenant est un « décollage ». D'une part, les capacités des modèles sont passées de « l'assistance à environ 20 % du travail » à « la couverture d'environ 80 % des tâches », déclenchant directement une restructuration des flux de travail ; d'autre part, l'IA participe à sa propre évolution (utiliser l'IA pour optimiser l'IA), superposant puces, applications et coordination au niveau de l'entreprise pour former une boucle fermée en accélération constante. L'IA n'est plus une technologie isolée, mais commence à devenir un moteur clé de la croissance économique.
Cependant, parallèlement, une autre série de problèmes émerge : méfiance du public, incertitude de l'emploi, controverses entourant les centres de données et limites de la sécurité et de la gouvernance. En réponse, la position de Brockman ne se limite pas à la technologie elle-même. Il souligne deux points : premièrement, les risques ne peuvent être résolus par un « contrôle centralisé » et nécessitent plutôt l'établissement d'une infrastructure sociétale autour de l'IA, similaire au réseau électrique ; deuxièmement, les capacités individuelles sont en pleine transformation : la question cruciale n'est plus « savez-vous utiliser l'outil », mais « pouvez-vous atteindre vos objectifs avec l'IA ».
Si la question d'hier était « que peut faire l'IA », la question actuelle est devenue : que devez-vous faire quand l'IA commence à accomplir la plupart des choses pour vous ?
Voici le texte original (légèrement édité pour la lisibilité) :
En bref
L'AGI est entrée dans la phase de « voie claire » : Greg Brockman (cofondateur d'OpenAI) estime que, sur la base du modèle de raisonnement de GPT, il existe désormais une voie claire vers l'AGI, prévue pour être atteinte dans quelques années, bien que la forme restera « irrégulière ».
Note : L'AGI (Artificial General Intelligence) désigne l'intelligence artificielle générale, signifiant des systèmes d'IA possédant des capacités équivalentes, voire supérieures, à celles des humains dans la plupart des tâches cognitives. Contrairement à l'« IA étroite » actuelle (reconnaissance d'images, algorithmes de recommandation), l'AGI met l'accent sur la généralité et la transférabilité entre les tâches.
Convergence stratégique : de l'exploration multi-lignes aux deux applications principales : Sous contraintes de calcul, OpenAI concentre ses ressources sur les « assistants personnels » et la « résolution de problèmes complexes », plutôt que de progresser dans toutes les directions simultanément (comme la génération vidéo).
Les « Super Apps » deviendront la forme d'entrée de l'IA : Le chat, la programmation, la navigation et le travail intellectuel seront intégrés dans un système unifié, faisant passer l'IA d'un outil à une « couche d'exécution », les utilisateurs devenant des « répartiteurs ».
Changement pivot : l'IA commence à prendre en charge les flux de travail plutôt que d'assister : La capacité des modèles a bondi de « l'exécution de 20 % des tâches » à « la gestion de 80 % », forçant les individus et les entreprises à restructurer leur façon de travailler.
La puissance de calcul devient le goulot d'étranglement et le centre de la concurrence : La demande en IA dépasse largement l'offre, la contrainte future ne résidant pas dans la capacité du modèle, mais dans les ressources de calcul, faisant des centres de données et de l'infrastructure des variables critiques.
Le « décollage » de l'IA est en cours : La technologie auto-accélérée (l'IA optimisant l'IA) combinée à la synergie industrielle (puces, applications, entreprises) propulse l'IA d'un simple outil à un moteur de croissance économique.
Le plus grand risque ne réside pas dans la technologie, mais dans la gouvernance et l'utilisation : Les problèmes de sécurité ne peuvent être résolus par une seule entité ; un écosystème ouvert et une infrastructure sociale doivent assumer cette responsabilité conjointement.
La compétence individuelle fondamentale se transforme : La compétitivité future ne réside plus dans l'« exécution », mais dans la « définition d'objectifs + la gestion de systèmes d'IA » ; l'utilisation proactive de l'IA deviendra une compétence de base.
Résumé de l'interview :
Alex (Hôte) :
Aujourd'hui, nous recevons Greg Brockman, cofondateur et président d'OpenAI, pour discuter des opportunités les plus prometteuses de l'IA, de la manière dont OpenAI prévoit de les saisir et du concept de « super apps ». Greg est présent dans notre studio d'enregistrement aujourd'hui.
Greg Brockman (Cofondateur et président d'OpenAI) :
Ravi de vous voir, merci de m'avoir invité.
Pourquoi arrêter Sora ? Puissance de calcul insuffisante
Alex :
En ce moment, OpenAI suspend l'avancement de la génération vidéo pour concentrer ses ressources sur une « super app » qui intégrera des scénarios commerciaux et de programmation. Extérieurement (y compris pour moi), on a l'impression qu'OpenAI a déjà pris une avance côté grand public, mais réalloue maintenant ses ressources. Que se passe-t-il ?
Note : En mars 2026, OpenAI a annoncé la fermeture de son produit de génération vidéo Sora (incluant l'application et l'API) et a mis fin aux efforts commerciaux associés.
Greg Brockman :
Au cours de la période écoulée, nous avons développé cette technologie d'apprentissage profond, dans le but de valider si elle pouvait réellement apporter l'impact positif que nous avons toujours envisagé — si elle pouvait être utilisée pour créer des applications qui aident vraiment les gens et améliorent leur vie.
Parallèlement, nous avons également poursuivi une autre voie : le déploiement de cette technologie. D'une part, pour soutenir les opérations commerciales, et d'autre part, pour accumuler de l'expérience réelle dès le début, en nous préparant au moment où la technologie arrivera à pleine maturité.
Et maintenant, nous avons atteint une nouvelle étape. Nous constatons que cette technologie est effectivement viable. Nous passons du stade du « benchmarking » et de démonstrations de capacités plutôt abstraites à une nouvelle phase : nous devons l'intégrer dans le monde réel, l'impliquer dans un travail concret et continuer à évoluer grâce aux retours des utilisateurs.
Je préfère donc comprendre ce changement comme : un virage stratégique dicté par un changement de phase technologique.
Cela ne signifie pas que nous passons du « grand public » à « l'entreprise ». Plus précisément, nous nous posons une question : dans une situation de ressources limitées, quelles applications devons-nous prioriser ? Parce que nous ne pouvons pas tout faire.
Quelles applications peuvent être réellement mises en œuvre, collaborer entre elles et avoir un impact réel ? Si vous listez toutes les directions, le côté grand public peut être divisé en plusieurs types : un assistant personnel, un système qui vous comprend vraiment, s'aligne sur vos objectifs et vous aide à réaliser vos buts de vie ; ainsi que la création et le divertissement, et bien d'autres possibilités. Côté entreprise, si vous regardez d'un niveau supérieur, cela peut être résumé en une chose : vous avez une tâche complexe, l'IA peut-elle vous aider à l'accomplir ?
Pour nous, la priorité actuelle est très claire, avec seulement deux choses au premier plan : premièrement, un assistant personnel ; deuxièmement, une IA capable de vous aider à résoudre des problèmes complexes.
Le problème est le suivant : avec notre puissance de calcul actuelle, nous ne pouvons même pas soutenir pleinement ces deux choses. Une fois que vous ajoutez plus de scénarios d'application, il est tout simplement impossible de tous les couvrir. C'est donc un retour à la réalité : la technologie arrive rapidement à maturité, l'impact est sur le point d'exploser, et nous devons faire des choix, sélectionner la direction la plus importante pour vraiment lui donner vie.
Alex :
Vous avez mentionné une métaphore auparavant, disant qu'OpenAI ressemble un peu à Disney : il possède une capacité centrale, puis peut s'étendre dans différents scénarios. Disney a Mickey Mouse, qui peut être utilisé dans des films, des parcs à thème, Disney+. Le « cœur » d'OpenAI est le modèle, qui peut être utilisé pour la génération vidéo, comme assistant, pour des applications d'entreprise.
Mais maintenant, il semble que vous ne suiviez plus cette voie d'« expansion globale », mais que vous deviez faire des choix. Est-ce exact ?
Greg Brockman :
En fait, je pense que cette métaphore est encore plus pertinente aujourd'hui. Mais le point clé est le suivant : techniquement, Sora (modèle vidéo) et GPT (modèle d'inférence) appartiennent en réalité à deux branches techniques différentes. La façon dont ils sont construits est complètement différente.
Le problème est qu'au stade actuel, faire avancer ces deux branches techniques simultanément est très difficile, surtout avec des ressources limitées. Le choix que nous avons fait est donc de concentrer les ressources principales sur la voie GPT à ce stade.
Bien sûr, cela ne signifie pas que nous abandonnons les autres directions. Par exemple, dans le domaine de la robotique, nous poursuivons toujours des recherches pertinentes. Mais la robotique elle-même en est encore à ses débuts et n'est pas encore entrée dans une phase de maturité explosive.
D'un autre côté, au cours de l'année à venir, nous verrons l'IA véritablement décoller dans le domaine du travail intellectuel.
Et il est important de souligner : la voie GPT ne concerne pas seulement le « texte ». Par exemple, l'interaction vocale bidirectionnelle (speech-to-speech) fait également partie de cette voie technique, rendant l'IA plus accessible et pratique. Ces capacités s'inscrivent essentiellement dans le même cadre de modèle, ajusté de différentes manières.
Cependant, si vous suivez deux branches techniques complètement différentes, il est difficile de tenir sur le long terme avec une puissance de calcul limitée. La puissance de calcul est limitée parce que la demande est trop élevée. Presque après chaque sortie de modèle, les gens veulent en faire plus.
Alex :
Alors pourquoi ne pas vous être concentrés sur la voie du « modèle mondial » (World Model) ? Par exemple, un modèle vidéo qui doit comprendre la relation entre les objets, ce qui est également crucial pour la robotique. De plus, les progrès de Sora ont été très rapides. Pourquoi avez-vous finalement choisi de parier sur GPT ?
Note : Le « modèle mondial » se concentre sur la perception et l'intuition physique, avec l'idée centrale de permettre à l'IA de comprendre « comment le monde fonctionne », et non pas seulement d'apprendre des « modèles de données de surface ». De tels modèles sont souvent utilisés pour décrire des systèmes comme Sora : ils ne génèrent pas seulement des images ou des vidéos, mais modélisent également les relations entre les objets (humains, voitures, lumière), les changements continus dans le temps (évolution entre les images) et les lois physiques fondamentales (mouvement, occlusion, collision). En revanche, GPT appartient aux modèles de langage et de raisonnement, plus axés sur la cognition abstraite et la capacité d'exécution de tâches.
Greg Brockman :
Le plus gros problème dans ce domaine est en fait le trop grand nombre d'opportunités.
Nous avons découvert très tôt chez OpenAI que tant qu'une idée est mathématiquement solide, elle fonctionne généralement et peut obtenir de bons résultats. Cela démontre la puissance sous-jacente de l'apprentissage profond, qui peut abstraire des règles de génération à partir de données et les transférer à de nouveaux scénarios. Cela peut être appliqué à divers domaines tels que les modèles mondiaux, les découvertes scientifiques et la programmation.
Mais la clé est : nous devons faire des choix.
Il y a toujours eu un débat sur jusqu'où les modèles de texte peuvent aller. Peuvent-ils vraiment comprendre le monde ? Je pense que nous avons maintenant la réponse à cette question : les modèles de texte peuvent atteindre l'AGI.
Nous avons vu une voie claire, et cette année, des modèles encore plus puissants émergeront. En interne chez OpenAI, l'une de nos plus grandes douleurs est la manière d'allouer la puissance de calcul — ce problème ne fera qu'empirer, pas s'améliorer. Donc, fondamentalement, ce n'est pas une question de « quelle voie est la plus importante », mais une question de timing et de séquence.
Maintenant, certaines applications que nous pensions lointaines commencent à devenir accessibles. Par exemple, la résolution de problèmes de physique non résolus. Nous avons récemment eu un cas où un physicien étudiait un problème depuis longtemps, a confié le problème à un modèle, et 12 heures plus tard, nous avions une solution. Il a dit que c'était la première fois qu'il avait l'impression qu'un modèle « réfléchissait ». Ce problème est peut-être même un problème que les humains ne pourront jamais résoudre, mais l'IA l'a fait.
Quand vous voyez quelque chose comme ça, votre seul choix est de doubler, tripler la mise. Parce que cela signifie que nous pouvons vraiment libérer un potentiel énorme.
Donc, pour moi, ce n'est pas une compétition entre différentes directions, mais plutôt : quelle est la mission d'OpenAI ? Comment apportons-nous l'AGI au monde ? Comment la rendons-nous vraiment bénéfique pour tout le monde ? Et nous avons vu cette voie, nous savons comment la faire avancer.
Parier sur GPT plutôt que sur les modèles mondiaux : une voie vers l'AGI
Alex :
Eh bien, je veux revenir aux modèles de nouvelle génération que vous avez mentionnés plus tôt, mais je veux d'abord poursuivre sur cette question.
Plus tôt cette année, j'ai discuté avec Demis Hassabis de Google DeepMind. Fait intéressant, il a dit que pour lui, la chose la plus proche de l'AGI était en fait leur générateur d'images appelé Nano Banana.
Note : Demis Hassabis est l'une des figures clés qui font passer l'IA de la recherche aux applications révolutionnaires. Il a cofondé DeepMind, qui a développé AlphaGo et a battu le champion du monde de Go en 2016, un événement marquant dans l'histoire du développement de l'IA.
Son raisonnement était le suivant : qu'il s'agisse d'un générateur d'images ou d'un générateur de vidéos, pour générer de telles images et vidéos, fondamentalement, vous devez comprendre l'interaction entre les objets, avoir au moins un certain niveau de compréhension de la façon dont le monde fonctionne.
Cela implique-t-il un risque potentiel ? Est-ce un gros pari — si c'est le cas, OpenAI continuera-t-il à doubler la mise sur une autre branche technologique et passera-t-il à côté ?
Greg Brockman :
Si c'est vraiment le cas ? J'ai deux réponses.
Premièrement, bien sûr, c'est une possibilité. C'est ainsi que fonctionne ce domaine ; vous devez finalement faire des choix, vous devez parier. Et OpenAI fait cela depuis le début : nous devons évaluer, croire en la voie vers l'AGI, puis pousser de manière très concentrée le long de cette voie. Tout comme l'ajout de vecteurs aléatoires, le résultat peut finalement être proche de zéro ; mais si vous alignez tous les vecteurs, ils peuvent vous propulser clairement dans une direction.
Cependant, le deuxième point est que la génération d'images est en fait aussi une capacité très populaire dans ChatGPT, et nous continuons d'investir et de prioriser l'avancement dans ce domaine. La raison pour laquelle nous pouvons le faire est que cela n'appartient pas réellement à la branche technique du « modèle mondial » ou du « modèle de diffusion » ; c'est en fait construit au-dessus de l'architecture GPT. Donc, même si cela fait face à une distribution de données différente, à un niveau technologique fondamental plus profond, c'est toujours la même chose.
Et c'est précisément l'une des choses les plus incroyables à propos de l'AGI : parfois, des applications très différentes en apparence — telles que le speech-to-speech, la génération d'images, le traitement de texte et l'application du texte lui-même dans divers scénarios comme la recherche scientifique, la programmation, les informations de santé personnelles, et plus encore — peuvent en fait toutes être logées dans le même cadre technique.
Donc, d'un point de vue technique, une chose à laquelle moi et l'entreprise avons toujours pensé est comment unifier nos efforts autant que possible. Parce que nous croyons vraiment que cette technologie apportera une amélioration holistique et pourrait même élever l'ensemble du système économique.
Et l'échelle de cette chose est trop vaste. Nous ne pouvons certainement pas tout faire, mais nous pouvons faire notre part.
Alex :
C'est ce que signifie ce « général » dans Intelligence Artificielle Générale (AGI).
Greg Brockman :
Exactement, c'est le « G », c'est vraiment ce que cela signifie.
Alex :
En parlant d'« unification », à quoi ressemblera cette super app à la fin ?
Greg Brockman :
La super app telle que je la vois —
Alex :
Elle intégrera le chat, la programmation, la navigation et des choses comme ChatGPT, tout ensemble, n'est-ce pas ?
Greg Brockman :
Oui. Ce que nous voulons créer est une application orientée utilisateur final qui vous permet de vraiment faire l'expérience de la puissance de l'AGI, c'est-à-dire sa « généralité ».
Si vous pensez aux produits de chat d'aujourd'hui, je pense qu'ils évolueront progressivement vers votre assistant personnel, votre API personnelle, une IA qui vous considère vraiment. Elle en sait beaucoup sur vous, s'aligne sur vos objectifs, est digne de confiance et peut, dans une certaine mesure, vous « représenter » dans ce monde numérique.
Quant à Codex, vous pouvez le considérer comme ceci : c'est actuellement un outil principalement conçu pour les ingénieurs logiciels, mais il évolue vers un « Codex pour tout le monde ».
Quiconque veut créer ou construire quelque chose peut utiliser Codex pour que l'ordinateur fasse ce qu'il veut. Et il ne s'agit plus seulement d'« écrire des logiciels » ; c'est plus comme « utiliser l'ordinateur » lui-même. Par exemple, je lui demande de m'aider à ajuster les paramètres de mon ordinateur portable. Parfois, j'oublie comment configurer les coins actifs, alors je demande simplement à Codex de le faire, et il le fait réellement.
C'est ainsi qu'un ordinateur devrait naturellement être ; il devrait s'adapter aux gens, ne pas me faire m'adapter à lui.
Vous pouvez donc imaginer une application comme celle-ci : tout ce que vous voulez que l'ordinateur fasse, vous pouvez le lui dire directement. Elle inclura la capacité d'« utiliser l'ordinateur » et de « naviguer sur le web », permettant à l'IA d'opérer réellement sur des pages web, et vous pourrez également superviser ce qu'elle fait. De plus, que votre interaction se fasse par chat, codage ou travail intellectuel général, toutes ces conversations seront unifiées dans un seul système. L'IA aura de la mémoire et vous comprendra.
C'est ce que nous construisons.
Mais pour être honnête, ce n'est que la partie émergée de l'iceberg, la partie visible au-dessus de l'eau. Pour moi, ce qui est vraiment plus important est l'unification de la technologie sous-jacente.
Nous avons mentionné l'unification au niveau des modèles sous-jacents, mais ce qui a vraiment changé au cours des dernières années est ceci : il ne s'agit plus seulement du « modèle » lui-même ; ce qui est plus crucial est le « système de déploiement ». En d'autres termes, comment les modèles obtiennent-ils du contexte ? Comment se connectent-ils au monde réel ? Quelles actions peuvent-ils entreprendre ? Comment fonctionne la boucle de rétroaction avec les utilisateurs à mesure que de nouveaux contextes émergent continuellement ?
En interne, par le passé, nous avions en fait plusieurs implémentations de ces choses, ou au moins quelques implémentations légèrement différentes. Maintenant, nous les consolidons en une seule. Finalement, nous aurons une couche d'IA unifiée, puis, de manière très légère, nous l'orienterons vers différents cas d'utilisation spécifiques.
Bien sûr, vous pouvez toujours créer un petit plugin, une petite interface, spécifiquement pour la finance ou le droit, mais dans la plupart des cas, vous n'en aurez peut-être même pas besoin car cette super app elle-même sera suffisamment large et générique.
Alex :
Cette application est-elle destinée à la fois aux cas d'utilisation en entreprise et personnels ?
Greg Brockman :
Oui, c'est en fait son cœur. Tout comme un ordinateur, comme votre ordinateur portable, est-il pour un usage personnel ou professionnel ? La réponse est les deux. C'est principalement votre appareil, votre interface avec le monde numérique. Et c'est exactement ce que nous voulons réaliser.
Alex :
Donc, d'un point de vue non professionnel, si j'utilise cette super app dans ma vie personnelle, à quoi l'utiliserais-je ? Comment ma vie changerait-elle ?
Greg Brockman :
Ma compréhension serait la suivante : dans votre vie personnelle, cela commencera par étendre la façon dont vous utilisez actuellement ChatGPT.
Comment utilisez-vous actuellement ChatGPT ? Les gens l'utilisent déjà pour accomplir une grande variété de tâches étonnantes. Parfois, c'est aussi simple que de dire : « J'ai besoin d'aide pour rédiger un discours pour un mariage, pouvez-vous m'aider ? » ou « Pouvez-vous jeter un œil à cette idée et me donner votre avis ? » Ou même : « Je dirige une petite entreprise, pouvez-vous me donner quelques idées ? »
Certains de ces scénarios sont plus personnels, tandis que d'autres commencent à brouiller les lignes entre personnel et professionnel. Et mon avis est : tous ces types de requêtes devraient être quelque chose qu'une super app peut gérer.
Greg Brockman :
Mais si vous regardez l'évolution de ChatGPT, il a lui-même évolué.
Il était sans état, n'est-ce pas ? Pour tout le monde, c'était la même IA, partant de zéro à chaque fois, presque comme parler à un étranger. Mais s'il peut se souvenir de vos interactions passées, il devient beaucoup plus puissant. S'il peut puiser dans plus de contexte, il devient aussi beaucoup plus puissant.
Par exemple, le connecter à votre email, votre calendrier, comprendre vraiment vos préférences, avoir un ensemble plus profond d'informations de base sur vos expériences passées, puis utiliser cela pour vous aider à atteindre vos objectifs. Par exemple, ChatGPT a déjà une fonctionnalité appelée Pulse, qui fournit du contenu quotidien basé sur sa compréhension de vous.
Donc, au niveau de l'utilisation individuelle, la super app englobera tout cela et le fera de manière plus profonde et plus riche.
Alex :
Quand prévoyez-vous de la lancer ?
Greg Brockman :
Une façon plus précise d'y penser est que, au cours des prochains mois, nous avancerons progressivement dans cette direction. La vision complète dont nous parlons sera livrée étape par étape, pas tout en une seule fois ; elle sera déployée par phases.
Par exemple, l'application Codex d'aujourd'hui contient en fait deux couches : l'une est un harnais d'agent générique qui peut utiliser des outils ; l'autre est un agent doué pour écrire du code.
Et ce harnais générique peut en fait être utilisé pour de nombreux autres scénarios. Vous le connectez à une feuille de calcul, vous le connectez à un document Word, et il peut vous aider dans le travail intellectuel.
Donc, notre première étape est de rendre l'application Codex plus conviviale pour le travail intellectuel général. Parce que nous avons déjà vu au sein d'OpenAI que les gens ont spontanément commencé à l'utiliser de cette manière.
Ce sera la première étape, avec beaucoup d'autres à venir.
Alex :
Quand je parlais à l'un de vos collègues de Codex hier, il a mentionné que quelqu'un utilise Codex pour le montage vidéo : il a demandé à Codex de l'aider à traiter des vidéos, Codex a même créé un plugin pour Adobe Premiere pour segmenter la vidéo, puis commencer le montage. Est-ce la direction que vous visez ?
Greg Brockman :
J'adore particulièrement entendre parler de ces cas d'utilisation. C'est exactement la façon dont nous espérons que ce système sera utilisé. Ce qui est vraiment intéressant, c'est que l'application Codex a été conçue à l'origine pour les ingénieurs logiciels, donc sa convivialité actuelle n'est en fait pas très élevée pour les non-programmeurs. Parce que pendant le processus de configuration, de nombreux petits problèmes peuvent survenir.
Les développeurs peuvent immédiatement comprendre ce que cela signifie et comment le résoudre ; nous y sommes déjà habitués. Mais si vous n'êtes pas un développeur, quand vous voyez cela, vous pourriez penser : « Qu'est-ce que c'est ? Je n'ai jamais vu cela auparavant. »
Cependant, même ainsi, nous avons vu beaucoup de gens qui n'ont jamais écrit de code auparavant commencer à l'utiliser pour construire des sites web ou faire des choses comme ce que vous venez de mentionner — automatiser les interactions entre différents logiciels, en tirant un levier important. Par exemple, quelqu'un de notre équipe de communication l'a intégré avec Slack et email pour lui faire traiter une grande quantité de retours, et il a produit de très bons résumés et analyses.
Donc, la situation actuelle est la suivante : ceux qui sont très motivés sont déjà prêts à surmonter ces obstacles, puis à en récolter de fortes récompenses.
Dans un sens, le plus dur est déjà fait — nous avons créé une IA vraiment intelligente et capable qui peut réellement accomplir des tâches.
Ce que nous devons faire ensuite est la partie relativement « facile » : la rendre vraiment utile au grand public, en brisant progressivement ces barrières à l'entrée.
Alex :
En regardant le paysage concurrentiel, Anthropic a maintenant aussi l'application Claude, qui inclut à la fois un chatbot et Claude Code. Dans une certaine mesure, ils ont déjà le prototype de leur propre « super app ».
Comment voyez-vous pourquoi Anthropic a fait ce mouvement plus tôt ? Et quelle est la probabilité selon vous qu'OpenAI rattrape son retard ?
Greg Brockman :
Si vous rembobinez l'horloge de 12 à 18 mois, nous nous sommes en fait toujours concentrés sur la « programmation » comme domaine clé et avons constamment excellé dans divers concours de programmation et autres tests de « compétence pure ». Cependant, une chose dans laquelle nous n'avons pas assez investi à l'époque était le dernier kilomètre de la convivialité.
C'est-à-dire que nous n'avons pas accordé assez d'attention à ce problème : l'IA est déjà très intelligente, capable de résoudre divers problèmes de programmation difficiles, mais elle n'a jamais vu de bases de code dans le monde réel — et les bases de code du monde réel sont souvent désordonnées, loin des environnements « propres » qu'elle connaît.
À ce stade, nous étions effectivement en retard. Mais à partir du milieu de l'année dernière, nous avons commencé à prendre cela très au sérieux. Nous avons spécifiquement formé une équipe pour examiner toutes ces lacunes, le désordre du monde réel et la complexité que nous n'avions pas vraiment rencontrés auparavant.
Par exemple, comment construire des données d'entraînement ? Comment configurer un environnement d'entraînement ? Qu'est-ce que cela fait vraiment pour l'IA de « faire de l'ingénierie logicielle » — être interrompue, rencontrer des problèmes étranges, diverses situations non idéales, et ainsi de suite.
Je pense que maintenant, nous avons rattrapé notre retard. Lorsque les utilisateurs nous comparent vraiment avec nos concurrents côte à côte, beaucoup de gens ont tendance à pencher davantage vers le choix de nous.
Bien sûr, nous savons aussi que nous avons un écart dans l'expérience front-end, et nous aborderons cette partie. Mais dans l'ensemble, c'est ce sur quoi nous nous sommes concentrés pendant cette période : ne pas simplement construire un modèle puis ajouter une coque de produit ; mais plutôt, penser à cela comme un produit complet dès le début. Tout en faisant de la recherche, nous pensons aussi : comment sera-t-il finalement utilisé ? C'est un changement qui s'est produit en interne chez OpenAI pendant cette période.
Donc, à mon avis, nous aurons une très forte vague de mises à niveau de modèles ensuite. Rien qu'en regardant la feuille de route de cette année, je suis très enthousiaste, il y a vraiment beaucoup de choses qui peuvent être accomplies.
En même temps, nous sommes aussi très concentrés sur le remplissage du dernier kilomètre de la convivialité.
Alex :
Depuis 2022, OpenAI a été comme le leader incontesté dans ce domaine. Évidemment, la concurrence maintenant ne concerne plus seulement les scores de test. Vous venez d'utiliser l'expression « nous avons rattrapé notre retard » vous-même.
L'atmosphère interne de l'entreprise a-t-elle aussi changé ? En d'autres termes, n'est-ce pas le même sentiment d'être loin devant dans un produit comme ChatGPT qu'auparavant, mais d'entrer réellement dans une vraie compétition.
Certains rapports externes montrent en fait ce changement — comme des réunions internes soulignant qu'OpenAI n'a plus aucune « tâche secondaire », et que tout le monde devrait se concentrer sur cette direction principale. Alors, quels types de changements se sont produits dans l'environnement et l'atmosphère internes maintenant ?
Greg Brockman :
Je dirais, pour moi personnellement, le moment le plus troublant chez OpenAI a été en fait après la sortie de ChatGPT.
Je me souviens d'être à la fête de fin d'année de l'entreprise, et il y avait ce sentiment de « nous avons réussi » dans l'air. Je n'avais jamais ressenti cela auparavant. Ma réaction à l'époque était : Non, nous ne sommes pas les gens qui ont réussi, nous sommes les outsiders.
Et nous l'avons toujours été. Les concurrents dans cet espace sont pour la plupart des grandes entreprises bien établies avec plus de financement, plus de personnes, plus de données, et presque toutes les ressources plus abondantes.
Alors pourquoi OpenAI est-il capable de rivaliser ? Dans une certaine mesure, la réponse est que nous ne nous sommes jamais sentis à l'aise. Nous nous sommes toujours vus comme le challenger.
En fait, pour moi, voir le marché commencer vraiment à adopter cette dynamique concurrentielle, voir d'autres concurrents émerger et bien réussir, a été une chose très saine.
Parce que, à mon avis, vous ne pouvez jamais vous fixer sur l'endroit où sont vos concurrents. Si vous regardez juste où ils sont maintenant, au moment où vous y arrivez, ils ont déjà avancé.
Et j'ai l'impression que, ces derniers temps, c'est en fait l'inverse : beaucoup de gens se sont concentrés sur où nous sommes, et nous avons pu continuer à avancer. Cela nous a donné un sentiment d'alignement et d'unité en interne.
J'ai mentionné plus tôt que nous traitions presque la « recherche » et le « déploiement » comme deux choses séparées ; et maintenant, nous voulons vraiment les intégrer. Pour moi, c'est une chose merveilleuse.
Donc je dirais, le stade où nous en sommes maintenant n'est pas une phase où je sens que nous avons jamais « gagné à coup sûr », ou soudainement en crise. Vous savez, les perceptions externes de vous ont tendance à ne pas être aussi bonnes qu'ils le disent, ni aussi mauvaises.
Je me sens globalement, nous avons en fait été assez stables. Et en termes de développement de modèle de base, je suis très confiant dans notre feuille de route et le travail de recherche que nous avons mis en place. Quant au côté produit, j'ai l'impression que nous avons une très bonne énergie maintenant, tout le monde se rassemble pour vraiment livrer ces choses au monde.
Alex :
Vous avez mentionné plusieurs fois plus tôt qu'il y aura de très nouveaux modèles forts à venir. Alors, quels sont-ils exactement ?
The Information a rapporté que vous avez terminé le pré-entraînement sur « Spud » ; et Sam Altman a aussi dit au personnel d'OpenAI en interne qu'ils devraient voir un modèle très fort dans quelques semaines. C'était il y a quelques semaines. L'équipe en interne croit qu'il pourrait même vraiment conduire à une accélération économique et les choses progressent plus vite que beaucoup de gens ne l'attendaient.
Alors, qu'est-ce que « Spud » exactement ?
Greg Brockman :
C'est un excellent modèle. Mais je pense que l'accent n'est pas vraiment mis sur un seul modèle.
Notre processus de recherche est à peu près comme ceci : d'abord le pré-entraînement, qui consiste à produire un nouveau modèle de base, puis toutes les améliorations ultérieures seront construites sur ce modèle de base. Et cette étape nécessite souvent beaucoup d'équipes internes au sein de l'entreprise pour fournir un effort énorme. En fait, au cours des 18 derniers mois, la plupart de mon temps a été passé ici : principalement autour de l'infrastructure GPU, soutenant les équipes responsables du cadre d'entraînement, et exécutant réellement ces tâches d'entraînement à grande échelle.
Ensuite vient l'étape de l'apprentissage par renforcement. C'est là que cette IA, qui a déjà appris beaucoup de connaissances mondiales, commence à vraiment appliquer ces connaissances.
Ensuite, c'est le processus de réglage fin (fine-tuning). À ce stade, vous lui direz en fait — eh bien, maintenant que vous savez comment résoudre des problèmes, allez-y et pratiquez dans divers scénarios différents.
Enfin, il y a une étape du « dernier kilomètre » concernant le comportement et la convivialité.
Donc, je verrais Spud comme une nouvelle fondation, un nouveau modèle de pré-entraînement. Et sur lui, vous pouvez dire que notre recherche au cours des deux dernières années commence à vraiment montrer des résultats. Cela va être très excitant.
Je pense que ce que le monde extérieur ressentira finalement est une amélioration globale de la capacité. Mais pour moi, cela n'a jamais été juste un problème de sortie unique. Parce qu'aussitôt que cette version sort, c'est en fait juste une version précoce de bien d'autres avancées à venir. Nous continuerons à faire plus à chaque étape de ce processus d'amélioration.
Donc je pense que nous sommes plus comme ayant un moteur de progrès toujours en accélération maintenant, et Spud est juste une étape sur cette route.
Alex :
Alors, que pensez-vous qu'il puisse faire que les modèles d'aujourd'hui ne peuvent pas ?
Greg Brockman :
Je pense qu'il sera capable de résoudre des problèmes plus difficiles et de devenir plus nuancé. Il comprendra mieux les instructions et le contexte.
Parfois, les gens parlent d'un sentiment appelé « odeur de gros modèle » — signifiant, quand le modèle est vraiment plus intelligent et plus capable, vous pouvez clairement le sentir. Il suivra votre intention plus étroitement et conviendra mieux à vos besoins.
Quand vous posez une question et que l'IA ne comprend pas vraiment ce que vous voulez dire, ce sentiment est encore très décevant. Vous ne pouvez pas vous empêcher de penser : C'est quelque chose que vous devriez clairement être capable de comprendre par vous-même.
Donc je dirais, dans un sens, ce sera un résultat de l'accumulation de nombreux « changements quantitatifs » menant à un « changement qualitatif ». D'une part, il y aura des améliorations significatives dans diverses métriques ; d'autre part, certains scénarios entièrement nouveaux émergeront : auparavant, vous auriez peut-être été trop paresseux pour utiliser l'IA parce qu'elle n'était pas assez fiable, mais maintenant vous l'utiliseriez sans hésitation.
Je pense que ce sera un changement complet. J'ai particulièrement hâte de voir comment il continuera à élever la limite de la capacité. Nous avons déjà vu sa performance dans des scénarios comme la recherche en physique, et je pense qu'ensuite, il sera capable d'aborder des problèmes plus ouverts et de couvrir des délais plus longs.
En même temps, j'ai aussi hâte de voir comment il élèvera le plancher de la capacité — signifiant que peu importe ce que vous voulez faire, il sera beaucoup plus utile qu'aujourd'hui.
Alex :
Mais pour l'utilisateur moyen, ressentir ce genre de changement n'est parfois pas facile. Par exemple, avant la sortie de GPT-5, il y avait en fait beaucoup de battage médiatique et d'anticipation ; cependant, quand il est réellement sorti, la réaction publique initiale était quelque peu décevante dans une certaine mesure. Plus tard, tout le monde a lentement découvert qu'il était en fait très puissant dans certaines tâches spécifiques.
Donc pour la prochaine génération de modèles, pensez-vous que ce sera principalement ressenti dans certains scénarios professionnels, ou sera-ce une sorte d'amélioration qui est plus intuitivement et universellement ressentie par tout le monde ?
Greg Brockman :
Je pense que l'histoire pourrait être similaire. Après la sortie du modèle, certaines personnes sentiront immédiatement que c'est une transformation complète par rapport à ce qu'elles ont vu auparavant. Mais il y aura aussi des cas d'utilisation où le goulot d'étranglement n'est pas dans l'« intelligence ». Donc, si vous rendez simplement le modèle plus intelligent, dans ces domaines, les utilisateurs pourraient ne pas immédiatement sentir la différence.
Cependant, avec le temps, je pense que tout le monde finira par sentir le changement. Parce que ce qui change vraiment est : dans quelle mesure vous commencez à compter sur ce système.
Si vous pensez à la façon dont nous interagissons avec l'IA maintenant, tout le monde a en fait un modèle mental de « ce qu'elle peut faire ». Et ce modèle mental ne change pas rapidement. Il évolue généralement à mesure que vous gagnez de l'expérience, puis il fait occasionnellement quelque chose de magique pour vous, et vous réalisez soudainement : wow, elle peut en fait faire cela, quelque chose à laquelle je n'avais jamais pensé auparavant.
Par exemple, dans des scénarios comme l'accès aux informations médicales, nous avons déjà vu des cas similaires. J'ai un ami qui a utilisé ChatGPT pour explorer différentes options de traitement pour son cancer. Le médecin lui avait précédemment dit que c'était un stade avancé, et qu'il n'y avait plus rien à faire. Mais il a utilisé ChatGPT pour rechercher beaucoup d'idées différentes et a en fait trouvé un traitement grâce à cela.
Dans un scénario comme celui-ci, la prémisse est en fait : vous devez avoir un certain niveau de confiance dans la capacité de l'IA à aider dans ce contexte avant d'être prêt à investir tant d'efforts pour extraire de la valeur du système.
Donc je pense que ce que nous verrons ensuite est : dans tout scénario d'application similaire, la chose avec laquelle l'IA peut vous aider deviendra plus évidente pour tout le monde.
Par conséquent, ce n'est pas seulement à propos de la technologie elle-même qui devient plus forte, mais aussi à propos de notre compréhension de la technologie qui change et la rattrape.
Alex :
Donc vous compterez de plus en plus sur elle. Au sein d'OpenAI, vous développez aussi un chercheur IA automatisé, qui est dit être lancé cet automne. Alors qu'est-ce que c'est exactement ?
L'IA entre dans sa phase de « décollage »
Greg Brockman :
Je pense, d'un point de vue de tendance globale, que nous sommes maintenant au stade précoce de ce décollage technologique.
Alex :
Que signifie « décollage » ?
Greg Brockman :
Décollage fait référence à l'IA qui devient continuellement plus forte le long d'une courbe exponentielle. Et une partie de la raison pour cela est : nous pouvons déjà utiliser l'IA pour nous aider à améliorer l'IA elle-même, donc tout le processus de recherche s'accélère aussi.
Mais je pense que ce « décollage » n'est pas juste une affaire technologique ; il signifie aussi la libération de l'impact du monde réel. Le développement de nombreuses technologies suit une courbe en S ; et si vous regardez plusieurs courbes en S sur une période plus longue, elles convergeront finalement vers une forme de croissance presque exponentielle.
Je pense que nous sommes actuellement dans une telle étape. C'est-à-dire que la technologie elle-même avance à un rythme de plus en plus rapide, et ce moteur de progrès gagne continuellement en élan.
En même temps, dans le monde extérieur, de nombreux vents arrière se forment : les développeurs de puces reçoivent plus de ressources ; beaucoup de gens travaillent sur diverses applications, essayant d'intégrer l'IA dans différents scénarios, et cherchant les points de convergence entre elle et divers besoins spécifiques.
Toute cette énergie s'accumule constamment, propulsant collectivement l'IA dans une « phase de décollage », la transformant d'une existence marginale en le moteur principal de la croissance économique.
Et cela ne se produit pas juste à l'intérieur des murs de notre organisation. Cela concerne le monde entier, l'ensemble du système économique, comment faire avancer collectivement cette technologie, et comment sa praticité continue de progresser.
Alex :
Alors que fera spécifiquement ce « chercheur » ?
Greg Brockman :
Le soi-disant « Chercheur » fait essentiellement référence à : à mesure que la proportion de tâches que l'IA peut prendre en charge augmente, nous devrions lui permettre d'opérer de manière plus autonome.
Bien sûr, il y a beaucoup d'aspects derrière cela qui nécessitent une réflexion attentive. Cela ne signifie pas : nous le sortons, le laissons fonctionner tout seul pendant un moment, puis revenons plus tard pour voir s'il a produit de bons résultats.
Je pense que nous serons toujours très profondément impliqués dans sa gestion. Tout comme maintenant, si vous avez un chercheur junior et que vous le laissez seul trop longtemps, il est probable qu'il emprunte une voie qui n'offre pas beaucoup de valeur. Mais si vous avez un chercheur senior, ou quelqu'un avec un vrai sens de la direction qui le dirige, il n'a peut-être même pas besoin de maîtriser personnellement toutes les compétences opérationnelles spécifiques mais peut toujours fournir des retours continus sur ce que la personne produit, le revoir, et fournir des conseils sur la direction : ce que j'espère exactement que vous accomplirez.
Donc le système tel que je le comprends est un ensemble de mécanismes que nous construisons qui augmentera significativement la vitesse de notre sortie de modèle, conduira à de nouvelles percées de recherche, et rendra ces modèles plus utiles et utilisables dans le monde réel. Et tout cela se produira à un rythme de plus en plus rapide.
Alex :
Que fera-t-il spécifiquement ? Lui direz-vous directement de « trouver l'AGI » et ensuite il essaiera par lui-même ?
Greg Brockman :
Dans une certaine mesure, je le vois de cette façon, au moins dans le premier sens. Mais si on le regarde d'un point de vue plus pratique, je le comprendrais comme : prendre l'ensemble du flux de travail de l'un de nos scientifiques de recherche du début à la fin et essayer de l'exécuter autant que possible dans un système basé sur le silicium.
Alex :
Une autre façon de comprendre « décollage » est : le progrès de l'IA passera d'une amélioration incrémentale à l'accumulation d'élan, évoluant finalement vers un processus de propulsion presque imparable vers une intelligence plus intelligente que les humains.
Êtes-vous inquiet que, tout comme les choses peuvent se développer dans une direction positive, ce progrès lui-même puisse aussi devenir incontrôlable, dévier ?
Greg Brockman :
Je pense, bien sûr, qu'il y en aura, cela ne fait aucun doute. Je crois que pour profiter des avantages de cette technologie, on doit aussi sérieusement considérer ses risques.
Si vous regardez notre approche du développement technique, vous constaterez que nous avons mis beaucoup d'efforts dans la sécurité et la protection. Un bon exemple est les attaques par injection de prompt. Si vous allez créer une IA très intelligente et puissante qui a accès à beaucoup d'outils, vous voulez certainement vous assurer qu'elle n'est pas égarée ou manipulée par quelqu'un qui lui donne une commande étrange.
C'est quelque chose dans lequel nous avons mis beaucoup d'efforts, et je pense que nous avons obtenu de très bons résultats. Nous avons aussi une équipe très forte responsable de ce travail.
Il est intéressant de noter que certains de ces problèmes peuvent en fait être comparés aux humains. Les humains sont aussi susceptibles aux attaques de phishing, peuvent être induits en erreur, et peuvent agir sans contexte complet.
Nous apportons ces analogies dans notre propre processus de R&D. Chaque fois que nous sortons un modèle, développons un modèle, nous pensons toujours : comment s'assurer qu'il s'aligne vraiment sur les objectifs humains, comment s'assurer qu'il aide effectivement ? C'est quelque chose dont nous nous soucions beaucoup.
Bien sûr, il y a aussi des problèmes plus importants impliquant le monde entier, l'économie entière : comment tout changera-t-il ? Comment tout le monde peut-il bénéficier de cette technologie ? Ce ne sont pas juste des problèmes techniques, ni OpenAI ne peut les résoudre seul. Mais oui, je pense souvent non seulement à faire avancer la technologie mais aussi à m'assurer qu'elle peut vraiment apporter un impact positif proportionnel à son potentiel.
Alex :
Le problème est, cela ressemble à une course. Ce qui se passe à l'intérieur des murs du siège d'OpenAI est aussi rapidement répliqué par de nombreux acteurs open-source. Et ces acteurs sont souvent beaucoup plus faibles en termes de limites de sécurité et de mesures de protection.
Je me souviens que vous avez dit quelque chose auparavant, l'essentiel était : les réalisations créatives nécessitent que beaucoup de gens fassent beaucoup de choses correctement, mais les résultats destructeurs peuvent seulement nécessiter un acteur malveillant. C'est au moins l'endroit qui m'inquiète le plus. Parce que c'est clairement une course, et le progrès est rapide. Beaucoup de vos pairs ont dit que si tout le monde accepte de s'arrêter, ils sont prêts à s'arrêter aussi. Mais maintenant, il semble qu'il n'y ait aucun signe de cette course ralentissant du tout.
Alors, la récompense vaut-elle vraiment la peine de prendre de tels risques ?
Greg Brockman :
Je crois que la récompense en vaut la peine. Cependant, je sens aussi qu'une telle réponse est encore trop large et trop simpliste.
Depuis la création d'OpenAI, nous nous sommes demandé : quel avenir constitue un bon avenir ? Comment cette technologie peut-elle vraiment élever la situation de tout le monde ?
Vous pouvez diviser cette question en deux perspectives. L'une est une vision « centralisée » : penser que pour rendre cette technologie sûre, la meilleure façon est qu'une seule entité la développe. Ensuite, il n'y a pas de pression concurrentielle, et vous pouvez soigneusement faire les choses correctement, et quand vous êtes prêt, décider comment la livrer à tout le monde. Cette idée est compréhensible, mais dans une certaine mesure, c'est aussi une solution très difficile à accepter.
Et une autre voie, qui est aussi la voie vers laquelle nous penchons, est de penser du point de vue de la « résilience ». En d'autres termes, de la voir comme un système ouvert : de nombreux participants conduisent le développement de cette technologie, mais l'accent n'est pas seulement sur la technologie elle-même mais plus sur la construction de l'infrastructure sociale autour de cette technologie, lui permettant d'être plus sécurisée.
Vous pouvez penser au développement de l'électricité. L'électricité est aussi produite par de nombreuses personnes et institutions différentes, et elle-même comporte des risques et des dangers. Cependant, en même temps, nous avons construit plusieurs couches d'infrastructure de sécurité autour d'elle : il y a des normes de sécurité électrique, diverses spécifications d'utilisation, des approches réglementaires correspondant à différentes échelles. À une très grande échelle, il y a même des exigences réglementaires spécialisées. Beaucoup de gens peuvent utiliser l'électricité de manière démocratisée, avec des inspecteurs et tout un ensemble de systèmes de soutien progressivement établis autour des caractéristiques de cette technologie.
Et je pense que l'IA est la même. Ce que nous voyons vraiment est qu'il doit y avoir une large discussion sociale autour de l'IA. Si cette technologie va vraiment arriver et changer la vie de tout le monde, alors les gens doivent être impliqués. Elle ne peut pas être uniquement conduite et décidée par un petit groupe centralisé en secret.
Donc, pour moi, cela a toujours été un problème très central : de quelle manière cette technologie devrait-elle se dérouler ? Et ce en quoi nous croyons vraiment est un « écosystème résilient » progressivement formé autour du développement technologique.
Alex :
Alors, dites-vous que nous sommes actuellement dans le processus de « décollage », et nous y sommes tous en fait déjà ? Le PDG de NVIDIA, Jensen Huang, a récemment dit qu'il croit que l'AGI a été atteinte. Êtes-vous d'accord ?
Greg Brockman :
Je pense que l'AGI a des définitions différentes pour des personnes différentes. Et en effet, beaucoup de gens soutiendraient que la technologie que nous avons aujourd'hui est déjà considérée comme l'AGI.
Cela peut être débattu. Mais je pense que la partie vraiment intéressante est que la technologie que nous avons aujourd'hui est encore très « brute », avec un sens clair de fragmentation.
Dans beaucoup de tâches, comme écrire du code, elle est déjà surhumaine. L'IA peut le faire, et elle a significativement réduit la friction de créer des choses. Mais en même temps, il y a encore des choses très basiques que les humains peuvent facilement faire mais avec lesquelles l'IA lutte encore.
Alors où tracez-vous la ligne ? Dans une certaine mesure, c'est plus comme un « sentiment », un jugement atmosphérique, plutôt qu'une question qui peut être strictement scientifiquement définie en ce moment.
Donc pour moi-même, je pense que nous traversons clairement ce moment. Si vous m'aviez montré ces systèmes aujourd'hui il y a cinq ans, j'aurais dit : Oui, c'est ce dont nous parlions à l'époque. C'est juste que la réalité a grandi, semblant très différente de ce que nous imaginions à l'origine. Elle est différente de toute forme que nous avions envisagée.
Donc je pense que nous devons ajuster nos modèles mentaux en conséquence.
Alex :
Alors vous voulez dire, nous n'y sommes pas encore ?
Greg Brockman :
Je dirais, nous sommes probablement à 70 % à 80 % déjà. Donc je pense que nous sommes en fait très proches.
Et je crois qu'une chose est très claire : dans les prochaines années, nous serons définitivement témoins de l'AGI. Sa performance peut encore être quelque peu « irrégulière », pas entièrement lisse et parfaite partout. Mais la limite inférieure des tâches qu'elle peut accomplir sera élevée très haut — presque pour toute tâche intellectuelle que vous devez effectuer sur un ordinateur, l'IA peut le faire.
Donc maintenant je dois donner une réponse quelque peu incertaine parce qu'il y a en effet un peu d'un « principe d'incertitude » là-dedans — vous pouvez l'argumenter à partir de différentes définitions. Mais selon ma définition personnelle, je pense que nous y sommes presque. Faites un pas de plus en avant, et nous y sommes absolument.
Point d'inflexion clé : Le transfert de travail de 20 % à 80 %
Alex :
Qu'est-ce qui s'est passé en décembre 2025 exactement. Parce que cela semblait être un tournant, l'idée de « laisser la machine écrire du code sans interruption pendant plusieurs heures d'affilée » est soudainement passée d'une idée théorique à tout le monde commençant à dire : « Je pense que je peux lui faire confiance pour continuer à fonctionner toute seule pendant un moment. »
Alors qu'est-ce qui s'est vraiment passé à ce moment-là ?
Greg Brockman :
Après la sortie du nouveau modèle, le pourcentage de tâches que l'IA pouvait effectuer a bondi d'environ 20 % de votre travail à 80 % d'un seul coup. C'était un changement extrêmement significatif. Parce que ce n'était plus juste « un assez bon petit outil », mais c'est devenu : vous deviez réorganiser votre flux de travail autour de ces IA.
Pour moi personnellement, j'ai aussi eu un moment viscéral très typique. Au fil des ans, j'avais un test : demander à l'IA de construire un site web pour moi. Ce site web était en fait un que j'avais construit à la main quand j'apprenais à coder, me prenant plusieurs mois.
Et d'ici 2025, cela prenait probablement encore quatre heures et plusieurs tours de prompts en arrière pour obtenir quelque chose de décent. Mais d'ici décembre, j'ai demandé une fois, et l'IA l'a fait une fois, et elle l'a très bien fait.
Alex :
Alors comment ces modèles ont-ils fait ce saut ?
Greg Brockman :
Une grande partie de la raison est que le modèle de base lui-même est devenu plus fort. OpenAI a continuellement amélioré ses techniques de pré-entraînement. Et à ce stade, nous avons vu un indice de ce à quoi ressemblerait le reste de l'année. Mais en même temps, ce n'était pas juste un point de percée unique. Plus précisément, nous avons poussé vers l'avant sur toutes les dimensions de l'innovation.
Une chose intéressante à propos de ces modèles est : dans un certain sens, vous pourriez sentir qu'ils ont eu ces moments de « discontinuité » encore et encore ; mais d'un autre point de vue, tout a été une évolution continue. Il n'a pas soudainement sauté de 0 % à 80 %, mais plutôt de 20 % à 80 %. Donc, d'une certaine manière, vous pourriez aussi dire qu'il est juste devenu meilleur.
Et je pense que ce progrès continue en fait dans chaque mise à jour de version mineure ultérieure. Par exemple, de 5.2 à 5.3, j'ai un ingénieur qui collabore étroitement avec moi qui initialement ne pouvait pas obtenir du modèle qu'il fasse le travail de systèmes de bas niveau et hardcore dont il était responsable ; mais d'ici la nouvelle version, le modèle pouvait prendre en charge ses documents de conception, vraiment les implémenter, ajouter une surveillance des métriques et une observabilité, exécuter un profileur pour l'analyse de performance, continuer à optimiser, et finalement atteindre le résultat qu'il espérait initialement livrer de ses propres mains.
Donc je dirais, c'est plus comme un processus de « progrès incrémental, et puis soudainement tout a changé ». Mais tout cela a en fait été préfiguré par les capacités actuellement en jeu. D'ici un an au plus tard, beaucoup de choses, certaines même beaucoup plus rapides, deviendront extrêmement fiables.
Alex :
Cela ne vous surprend-il pas aussi ? Parce que je me souviens qu'il n'y a pas longtemps, vous avez mentionné dans une interview que des outils comme Codex, un outil de programmation automatique, étaient à l'origine seulement pour les développeurs de logiciels. Mais plus tôt dans la conversation d'aujourd'hui, vous avez dit qu'en fait tout le monde peut utiliser ces types d'outils.
Qu'est-ce qui vous a fait changer d'avis ?
Greg Brockman :
J'ai en fait toujours encadré Codex dans le contexte de « l'écriture de code ». Après tout, son nom a code dedans, donc c'est naturel de le voir comme un outil pour les programmeurs. Et au sein d'OpenAI, beaucoup d'entre nous sont des ingénieurs logiciels nous-mêmes, construisant des outils pour nous-mêmes, donc c'était très naturel de penser de cette façon.
Mais à mesure que cette technologie progressait, nous avons commencé à réaliser quelque chose : la technologie sous-jacente que nous avons réellement construite ne concerne pas principalement le « code » du tout, elle concerne fondamentalement la « résolution de problèmes ».
À son cœur, il s'agit de gérer le contexte, construire un cadre d'exécution, et penser à comment l'IA devrait se brancher sur le travail réel, comment réellement faire avancer les choses. Et une fois que cela est établi, même dans un contexte de programmation, cela signifie soudainement que n'importe qui peut avoir cette capacité. Parce que ce que vous avez vraiment est un système qui peut faire le travail pour vous. Tant que vous avez une vision, un objectif à accomplir, et que vous pouvez décrire votre intention clairement, l'IA peut y aller et exécuter, peut faire avancer les choses.
Mais cela vous fera aussi commencer à vous demander, pourquoi est-ce que je me concentre seulement sur la division « non-programmation » ou « programmation » ? En fait, il y a beaucoup de travail qui est essentiellement juste une sorte de compétence mécanique. Comme les feuilles de calcul Excel, comme faire des présentations. Si l'IA a déjà assez de contexte et une intelligence brute suffisante, elle peut en fait très bien faire ces choses maintenant.
Donc, si nous la rendons juste plus accessible, plus conviviale, cela passera de « Codex est pour les programmeurs » à soudainement « Codex est pour tout le monde ».
Alex :
Et après avoir vu ce progrès clairement visible, la Silicon Valley a rapidement vu un autre phénomène presque silencieux émerger, qui est Open Claw, n'est-ce pas ? Ou plus largement, toute la communauté technologique commence à faire confiance à l'IA de la manière dont vous venez de mentionner — comme confier le contrôle du bureau à un robot IA, ou configurer un Mac mini, lui donner des permissions pour email, calendrier, fichiers, et puis dans une certaine mesure, le laisser « prendre le contrôle de la vie ».
Plus tard, OpenAI a amené le fondateur d'Open Claw dans l'entreprise. Alors pourriez-vous parler un peu plus de ce genre d'IA qui « vous aide à gérer votre vie » ? Amener l'équipe Open Claw, la vision sous-jacente est-elle quelque chose comme ça ?
Greg Brockman :
Je dirais, l'aspect le plus central de cette technologie est : comprendre comment elle peut être utile, comment les gens veulent réellement l'utiliser, quelle est la vision de l'agent intelligent, comment il entrera dans la vie des gens — ce sont toutes des questions très difficiles.
Ce que j'ai vu à plusieurs reprises dans cette évolution de la technologie est que ceux qui sont vraiment prêts à s'engager profondément, pleins de curiosité, et ont une forte imagination, cela en soi est une capacité très réelle, et elle deviendra une capacité de plus en plus précieuse dans la nouvelle économie.
Le fondateur d'Open Claw, Peter, à mon avis, est une telle personne ; il a une très forte imagination et une forte impulsion créative. Donc, d'une certaine manière, cela est lié à une technologie spécifique ; mais d'une autre manière, ce n'est pas juste un problème technique du tout. Cela concerne vraiment : comment intégrons-nous ces capacités dans la vie des gens, trouver où elles appartiennent vraiment.
Donc, en tant que technologue, c'est certainement excitant ; mais en tant que quelqu'un qui se soucie vraiment de livrer une valeur pratique aux utilisateurs, nous investissons maintenant massivement dans cela, investissons beaucoup.
Alex :
Vous avez récemment eu un commentaire intéressant à ce sujet. Vous avez dit, quand vous commencez à avoir ces agents IA autonomes qui travaillent pour vous, vous deviendrez le « PDG d'une flotte de milliers d'agents intelligents » qui travaillent pour vous pour atteindre vos objectifs, vision, et tâches, et vous n'êtes plus profondément impliqué dans les détails de la façon dont divers problèmes sont résolus.
Mais vous avez aussi mentionné que, dans un sens, cette nouvelle façon de travailler peut faire sentir aux gens qu'ils perdent le « pouls » du problème lui-même.
Greg Brockman :
Est-ce vraiment une bonne chose ? Je pense que c'est une épée à double tranchant.
Donc je pense que ce que nous devons faire est, d'une part, reconnaître la vraie puissance que ces outils peuvent apporter, et d'autre part, essayer d'atténuer autant que possible les faiblesses qu'ils apportent. Par exemple, donner aux gens un plus grand levier, donner aux gens une plus grande agence — si vous avez une vision, quelque chose que vous voulez accomplir, alors vous pouvez mobiliser toute une flotte d'agents pour le faire pour vous, ce qui est bien sûr très puissant.
Mais si vous pensez à la façon dont le monde fonctionne, à la fin il doit y avoir quelqu'un de responsable. Supposons que vous construisez un site web et que votre agent gâche les choses, affectant finalement l'utilisateur, strictement parlant, ce n'est pas la faute de l'agent, c'est votre faute. Donc vous devez vous en soucier.
Je pense que quiconque veut vraiment utiliser ces outils doit reconnaître : l'agence humaine, la responsabilité humaine, sont des parties centrales de tout le système. Comment les humains utilisent l'IA est fondamentalement important.
Donc je pense que le point le plus important est : en tant qu'utilisateurs de ces agents — nous sommes aussi comme ça au sein d'OpenAI — vous ne pouvez pas abdiquer la responsabilité. Vous ne pouvez pas juste dire, « L'IA s'occupera de tout toute seule. »
Alex :
Bien sûr. Mais ce que vous venez de dire à propos de « sentir que vous perdez le pouls du problème » semble être différent de la « responsabilité ».
Greg Brockman :
Pour moi, ces deux sont en fait connectés. Parce que la clé est : si vous êtes un PDG, mais que vous êtes trop éloigné des détails — comme si vous dirigez une équipe, dirigez une entreprise, mais que vous avez perdu le contact avec la ligne de front, cela ne mène généralement pas à de bons résultats. Donc ce que je voulais exprimer juste maintenant n'est pas que « les humains peuvent enfin ne rien savoir » est quelque chose qui vaut la peine d'être poursuivi.
Bien sûr, certains détails peuvent en effet être confiés avec confiance. Comme quand vous engagez un entrepreneur général pour construire votre maison, il y a beaucoup de détails que vous n'avez probablement pas besoin de superviser personnellement parce que vous faites confiance au fait que l'autre partie le gérera bien. Mais finalement, si certains détails clés tournent mal, vous devriez toujours vous en soucier et vous devriez toujours savoir.
Donc voici une différence subtile très importante : vous ne pouvez pas juste dire aveuglément, « Je suis prêt à perdre ce sens de la saisie sur le problème. » Au lieu de cela, nous devrions dire activement : j'ai toujours besoin de maintenir cette conscience pour vraiment comprendre les forces et les faiblesses du système.
Et à mesure que vous commencez à vous extraire de certaines des transactions plus bas niveau, plus mécanistes, la raison pour laquelle vous êtes capable de faire cela devrait être parce que vous avez déjà établi la confiance dans ce système, confirmant qu'il fait effectivement les choses correctement.
Alex :
Concernant les modèles, j'ai une dernière question. Vous avez mentionné une voie d'évolution de modèle : du pré-entraînement, au réglage fin, à l'apprentissage par renforcement, le rendant meilleur à résoudre des problèmes étape par étape et capable d'effectuer des tâches sur internet.
Et maintenant nous avons atteint un stade où le modèle a appris à utiliser des outils à travers ce processus. Si je comprends bien, quelle serait la prochaine étape dans cette voie d'évolution ?
Greg Brockman :
Je pense, le monde dans lequel nous sommes maintenant est un monde où les capacités des machines s'approfondissent et s'étendent continuellement. Une partie concerne certainement l'utilisation d'outils, mais en même temps, nous devons aussi vraiment rendre les « outils » eux-mêmes assez bons. Par exemple, si l'IA peut déjà faire des « opérations informatiques » et utiliser des systèmes de bureau comme les humains, alors en principe, elle peut faire tout ce que vous pouvez faire.
Mais en même temps, nous devons aussi fournir beaucoup de choses au niveau de l'infrastructure pour la machine. Par exemple, dans un environnement d'entreprise, comment faites-vous la gestion de l'authentification et de l'autorisation d'identité ? Comment faites-vous les pistes d'audit et l'observabilité ? Pour rattraper le développement des capacités sous-jacentes du modèle, beaucoup de technologies de soutien doivent être construites.
Et d'une direction globale, je pense que cela inclura des choses comme une « interface vocale très naturelle ». C'est-à-dire, vous pouvez avoir une conversation naturelle avec un ordinateur comme vous le faites maintenant, où il peut vraiment vous comprendre, faire ce dont vous avez besoin qu'il fasse, et fournir des suggestions précieuses.
Par exemple, il vous rappellera proactivement : quelque chose sur lequel vous avez progressé est maintenant bloqué, et le problème est ici. Ou quand vous vous réveillez le matin, il vous dira : voici votre briefing quotidien, combien de travail vos agents ont progressé la nuit dernière.
Peut-être qu'il dirige même une entreprise pour vous — je pense que ce serait une énorme application de cette technologie. La démocratisation de l'entrepreneuriat arrivera définitivement. Il vous dira : ces zones sont problématiques ; un client est très insatisfait maintenant et veut parler à une vraie personne, vous feriez mieux de le gérer vous-même. Ces choses arriveront.
Ensuite, je pense que la prochaine étape inclut aussi : la limite supérieure des défis pour les humains continuera d'être élevée par cette technologie. Nous sommes en fait déjà à l'avant-garde de cette tendance. Ce qui m'excite le plus est presque analogue au Coup 37 d'AlphaGo — ce coup est quelque chose que les humains n'auraient jamais fait, il est créatif, et il a changé la compréhension de beaucoup de gens du jeu.
Ce genre de chose arrivera dans chaque domaine. Cela arrivera dans la science, les mathématiques, la physique, la chimie ; cela arrivera dans la science des matériaux, la biologie, la santé, la découverte de médicaments ; et cela pourrait même arriver dans la littérature, la poésie, et beaucoup d'autres domaines. Il débloquera de nouveaux espaces de créativité humaine et de compréhension de manières que nous ne pouvons pas encore imaginer aujourd'hui.
Alex :
Mais si le modèle est déjà aussi puissant que vous le dites, pourquoi cela n'est-il pas arrivé pour de vrai jusqu'à maintenant ?
Greg Brockman :
Je pense qu'il y a un « décalage de capacité » en jeu ici — signifiant qu'il y a encore un écart significatif entre les capacités réelles du modèle et la façon dont les gens l'utilisent actuellement. Dans une certaine mesure, notre compréhension de ce qui est « à l'intérieur » du modèle évolue encore.
Donc je crois que même si le progrès technologique devait s'arrêter à partir de ce point, le monde subirait toujours un changement massif — une économie pilotée par le calcul, pilotée par l'IA arrivera toujours.
Mais en même temps, il y a une autre couche à cela : ce que nous faisons le mieux en ce moment est d'entraîner des modèles sur des tâches qui sont « mesurables ». Donc initialement, nous avons commencé avec des problèmes de maths, des tâches de programmation parce que ces tâches ont des validateurs très clairs : soit la réponse est correcte ou non, rendant facile de juger. Et avec le temps, la raison pour laquelle nous avons pu pousser progressivement les modèles vers des questions plus ouvertes est en élargissant la portée de « ce qui peut être validé, évalué ».
L'IA elle-même peut aussi aider avec cela. Si l'IA est assez intelligente, comprend la tâche, et reçoit un critère d'évaluation, elle peut apprendre progressivement. Cependant, des tâches comme l'écriture créative, comme « à quel point ce poème est-il bon », sont difficiles à noter.
Par conséquent, dans ces types de scénarios par le passé, il a effectivement été difficile d'amener l'IA à vraiment apprendre par essai et rétroaction continus. Cependant, tout cela change, et nous avons déjà une vue assez claire de la voie à suivre.
Alex :
C'est assez intéressant. Peter Thiel a dit une fois quelque chose du genre : si vous êtes bon en maths, l'impact que vous pourriez ressentir devant ces modèles pourrait être encore plus grand que celui d'une personne « bonne avec les mots ». Et vous étiez aussi membre du Club de Maths à l'époque. N'êtes-vous pas inquiet à ce sujet ?
Greg Brockman :
Je pense que les gens ont tendance à voir plus de ce qu'ils ont perdu plutôt que ce qu'ils ont gagné. C'est parce que nous avons une expérience profonde de « comment je faisais cela ». Par exemple, je participais à des concours de maths, et maintenant l'IA peut aussi faire des concours de maths. Mais le truc est, cela n'a jamais vraiment été à propos des « concours de maths » en soi, n'est-ce pas ? Ce n'est pas la chose centrale qui conduit le progrès humain.
Si vous regardez comment nous travaillons maintenant — assis devant une boîte, tapant sur une autre — nous ne vivions pas comme cela il y a cent ans. Ce n'est pas un état naturel, ni vraiment comment nous devrions exister dans ce monde numérique dans lequel nous avons été balayés.
Ce n'est pas l'essence d'« être humain ». Ce qui compte vraiment est d'être présent, de vivre dans le moment, et de se connecter avec les autres.
Et je crois que ce que nous sommes sur le point de voir est : l'IA libérera une quantité significative de temps, permettant aux humains plus d'opportunités de renforcer les connexions les uns avec les autres, de construire plus de liens entre les gens.
Cela m'excite grandement.
Alex :
D'accord. Donc, à mesure que vous avancez davantage vers ces applications plus semblables à des agents, il y a une discussion qui émerge sur la question de savoir si de grandes tâches d'entraînement seront encore nécessaires à l'avenir ?
Surtout quand le modèle est déjà assez bon, il semble que vous puissiez juste le déployer dans le monde réel et obtenir une amélioration significative à travers de nombreuses étapes qui ne reposent pas sur le pré-entraînement. Et ceux qui nécessitent vraiment un support massif de centre de données sont principalement pour le pré-entraînement, en fait.
Vous avez toujours été en charge de la mise à l'échelle, conduisant cet effort. Comment voyez-vous cet argument ?
Greg Brockman :
Je pense que cet argument néglige un point très important dans l'avancement technologique. En effet, chaque étape dans le pipeline de production de modèle amplifie les effets les uns des autres. Donc vous voudriez que chaque étape devienne plus forte.
Nous voyons que : une fois que le pré-entraînement devient plus fort, chaque étape ultérieure devient beaucoup plus facile. Cela a en fait du sens. Parce que le modèle est plus capable dès le début, il apprend plus vite ; il avance aussi plus vite alors qu'il essaie différentes approches, apprend de ses erreurs, et progresse plus vite avec moins d'erreurs à cause de sa fondation plus forte.
Ainsi, le vrai grand changement n'est pas que nous passons de « l'entraînement d'un système rationnel fermé et auto-dérivé » à « juste le laisser faire des erreurs dans le monde réel ». Au lieu de cela, nous réalisons que nous devons non seulement rendre le modèle lui-même plus grand et plus fort, mais aussi le laisser essayer des choses, comprendre comment les gens l'utilisent dans le monde réel, et nourrir ce retour d'utilisation dans le processus d'entraînement. Cela ne diminue pas la valeur de continuer à faire avancer cette recherche, ni ne diminue son importance.
Je pense aussi qu'il y a un autre changement : par le passé, nous nous concentrions principalement sur l'amélioration des capacités brutes pendant la phase de pré-entraînement, mais n'insistions pas autant sur la capacité pendant le stade de raisonnement ou d'inférence. Et au cours des 24 derniers mois, un changement significatif a été que nous commençons à réaliser le besoin d'un équilibre entre les deux.
En d'autres termes, vous pouvez avoir un modèle avec une très forte capacité, mais il doit aussi être assez efficace pendant l'inférence et le déploiement réel. Parce que si vous allez faire de l'apprentissage par renforcement et vraiment le déployer dans le monde réel, tout cela nécessite une très forte efficacité d'inférence.
Cela signifie aussi que vous ne pousserez pas nécessairement l'échelle d'entraînement au plus grand possible théoriquement, parce que vous devez aussi considérer les scénarios d'utilisation à grande échelle ultérieurs.
Ce que vous voulez vraiment est : le point optimal du produit entre le niveau d'intelligence et le coût, plutôt que juste optimiser une dimension.
Alex :
Si l'avenir se déplace principalement vers l'inférence, n'auriez-vous plus besoin des GPU de Nvidia autant ?
Greg Brockman :
Nous en avons toujours absolument besoin.
Alex :
Pourquoi ?
Greg Brockman :
Il y a beaucoup de raisons.
L'une d'elles est : peu importe comment le ratio entre l'entraînement et l'inférence change, l'entraînement à super grande échelle est toujours quelque chose qui peut seulement être fait en concentrant une puissance de calcul massive sur un problème, et actuellement il n'y a pas de moyen alternatif de faire cela.
Donc je pense que ce qui est plus susceptible d'arriver à l'avenir est : la proportion de puissance de calcul du côté du déploiement augmentera significativement ; mais en même temps, il y aura toujours des moments où vous devrez mener une tâche de pré-entraînement particulièrement grande, et à ce moment-là vous devez toujours concentrer une grande quantité de puissance de calcul.
Et je pense aussi que l'équipe de Nvidia est vraiment exceptionnelle, le travail qu'ils font est incroyable. Donc, oui, nous travaillons très étroitement avec eux.
Alex :
Y aura-t-il un jour où les gens commenceront à dire, « Nous avons assez pré-entraîné, le modèle est déjà assez intelligent » ?
Greg Brockman :
Je pense que c'est un peu comme dire : quand les humains auront résolu tous les problèmes devant eux, peut-être que nous pourrons dire cela. Mais je pense que la limite de ce que nous voulons atteindre est en fait beaucoup plus élevée.
Au cours des 50 dernières années, dans une certaine mesure, notre ambition pour beaucoup d'objectifs a en fait diminué. Par exemple, certains problèmes semblent très clairs — pouvons-nous assurer que tout le monde a une couverture santé ? Et pas juste « traiter quand il y a un problème », mais vraiment atteindre la santé préventive, se concentrer sur le mode de vie, aider les gens tôt, détecter les risques potentiels avant qu'une maladie ne survienne. Je pense que nous pouvons en fait utiliser des modèles plus intelligents pour vraiment résoudre ces types de problèmes.
Bien sûr, peut-être y a-t-il un niveau où ce problème a été minutieusement abordé, et à ce stade vous pourriez demander : Ai-je encore besoin d'un modèle deux fois plus intelligent ? Mais en même temps, il y aura certainement d'autres problèmes exigeant un niveau d'intelligence plus élevé.
La puissance de calcul n'est pas un coût, mais un moteur de revenus
Alex :
Parlons des chiffres derrière la construction de ces centres de données. Plus tôt cette année, vous avez levé 110 milliards de dollars. Comment les maths ont-elles fonctionné là-bas ? Cet argent va-t-il directement dans les centres de données ? Comment pensez-vous retourner cet argent aux investisseurs à l'avenir ? Parlez de cette logique dans le calcul.
Greg Brockman :
Je pense, fondamentalement, que c'est très simple : notre plus grosse dépense en ce moment est la puissance de calcul. Mais vous ne pouvez pas juste regarder la puissance de calcul comme un centre de coûts ; c'est plus comme un centre de revenus.
Vous pouvez penser à cela comme embaucher une équipe de vente. Combien de vendeurs êtes-vous prêt à embaucher ? Tant que votre produit peut être vendu, tant que vous avez un mécanisme pour mettre à l'échelle les ventes de ce produit, plus vous embauchez de vendeurs, plus les revenus sont élevés.
Et le monde dans lequel nous sommes en ce moment est que nous continuons à découvrir que nous ne pouvons tout simplement pas construire de calcul assez vite pour suivre la demande. Cela, je peux le sentir très concrètement en ce moment. Nous devons prendre des décisions très douloureuses : quelles fonctionnalités peuvent aller en direct, quelles fonctionnalités ne peuvent pas pour le moment ; où la puissance de calcul va-t-elle en premier, et où elle ne va pas.
Et je pense, à mesure que l'économie entière se déplace vers une économie pilotée par l'IA, cette situation sera beaucoup plus largement ressentie.
Quels vrais problèmes futurs vont être : quels problèmes peuvent obtenir ce genre de calcul massif ? Comment mettez-vous à l'échelle de telle sorte que tout le monde ait sa propre IA personnelle ? Comment amenez-vous tout le monde à utiliser des systèmes comme Codex ?
En ce moment, il n'y a tout simplement pas assez de calcul dans le monde pour soutenir ces choses. Donc nous nous préparons à ce problème à l'avance.
Alex :
Mais c'est finalement une toute nouvelle catégorie, n'est-ce pas ? Et vous utilisez un très fort déterminisme pour parier — un montant si grand, presque invisible dans le monde. Quand vous créez une nouvelle catégorie, comment pouvez-vous être si sûr qu'elle finira par tenir ?
Greg Brockman :
Je pense qu'il y a plusieurs composants à cela.
Premièrement, il y a en fait un précédent historique maintenant. Dès le moment où ChatGPT est sorti, je me souviens avoir eu une conversation très claire avec moi-même et l'équipe. Quelqu'un m'a demandé : combien de calcul devrions-nous acheter ? J'ai dit : tout. Ensuite quelqu'un a demandé encore : non, sérieusement, combien devrions-nous acheter ? J'ai dit : peu importe comment nous construisons, je sais que nous ne pouvons pas suivre la demande.
Et chaque année depuis lors a prouvé ce point. Le défi est que de telles approvisionnements en puissance de hachage doivent typiquement être verrouillés 18 mois à l'avance, parfois 24 mois, ou même plus. Donc, vous devez faire l'appel bien avant que les machines ne soient réellement livrées. Cela signifie que vous devez être incroyablement tourné vers l'avenir.
Et le monde vers lequel nous nous dirigeons est : à ce jour, le gros de nos revenus provient toujours des abonnements grand public, qui resteront aussi très importants à l'avenir. Bien sûr, nous créons aussi d'autres flux de revenus.
Mais l'opportunité émergente, plus grande maintenant, est le travail intellectuel.
Et cela, nous l'avons déjà vu très concrètement : presque chaque entreprise commence à réaliser que cette technologie est en fait utile, et si elles veulent rester compétitives, elles doivent l'adopter. Vous pouvez voir ce momentum très naturel, beaucoup d'ingénieurs logiciels l'utilisent déjà ; et maintenant vous commencez à voir une prolifération plus large, des gens au sein de l'entreprise l'incorporant dans divers scénarios de travail intellectuel. Et la volonté de payer qui a émergé dans cette industrie, et la croissance des revenus que vous voyez, est très claire.
Cela se produit en ce moment. Vous avez juste besoin de l'extrapoler. Et une chose que nous pourrions voir plus clairement que d'autres est : nous pouvons mieux voir comment ces modèles progresseront ensuite.
En mettant toutes ces choses ensemble, vous réalisez : cette économie elle-même est une chose extrêmement massive, presque inimaginable. Et à partir de maintenant, le moteur principal de croissance pour cette économie sera l'IA — à quel point vous pouvez tirer parti de l'IA et combien de puissance de hachage vous avez pour la conduire.
Alex :
Vous venez de mentionner que les abonnements grand public sont actuellement votre plus grande source de revenus. Donc, est-ce votre jugement qu'à l'avenir, cela sera inversé, et les entreprises deviendront la plus grande source de revenus ?
Greg Brockman :
Je pense qu'il est maintenant très clair que ce « côté entreprise » croît rapidement. Bien sûr, le terme « côté entreprise » lui-même évolue aussi. Parce que ce vers quoi il pointe vraiment est : les gens utilisant l'IA dans un travail intellectuel productif.
Et en termes de tarification, je ne pense pas que les catégories seront nécessairement aussi tranchées qu'elles l'étaient auparavant. Par exemple, le modèle d'utilisation actuel de Codex est : si vous avez un abonnement grand public à ChatGPT, vous avez déjà accès à Codex.
Donc je ne pense pas que l'avenir sera une telle division distincte entre B2B et B2C. Le scénario le plus probable est : en tant qu'utilisateur, vous aurez un point d'entrée unifié — tout comme votre ordinateur portable, qui est votre passerelle vers le monde numérique.
Et les revenus réels, fondamentalement, viendront d'ici.
Alex :
Dario a dit quelque chose, et je pense qu'il parlait peut-être de vous : certains acteurs ont poussé le cadran du risque trop haut, et il est très inquiet à ce sujet. Je pense qu'il faisait référence à votre pari massif sur l'infrastructure. Quel est votre avis sur cette déclaration ?
Greg Brockman :
Je ne suis pas d'accord. Je pense que nous avons toujours été très prudents, et nous avons effectivement vu ce qui arrive ensuite. Je crois que même en regardant juste cette année, tous ceux qui ont vraiment participé sentiront la « contrainte de calcul ».
Et je pense que nous avons juste réalisé cela plus tôt que les autres, nous préparant plus tôt à la façon dont la technologie se déroulerait.
Ce que j'ai vu à la place est que beaucoup d'autres participants ont probablement seulement réalisé cela à la fin de l'année dernière et se sont ensuite précipités pour trouver du calcul, seulement pour découvrir qu'il n'y en avait presque plus à acheter.
Donc je pense qu'il est facile de dire des choses comme ça. Mais la réalité est, tout le monde réalise maintenant : cette technologie est viable, elle est ici, elle est réelle. L'ingénierie logicielle est juste le premier exemple clair de cela.
Et ce qui nous contraint vraiment est le calcul disponible.
Alex :
Il a aussi dit que si sa prédiction dévie même légèrement, son entreprise pourrait faire faillite. Faites-vous face au même risque ?
Greg Brockman :
Je pense qu'il y a en fait plus d'une « trappe » ici. Si vous commencez à penser sérieusement au côté négatif — et je pense que c'est une question parfaitement juste — vous découvrirez que dans une certaine mesure, ce pari n'était pas vraiment sur une entreprise.
C'était vraiment sur l'industrie entière. C'est un pari sur : croyez-vous que cette technologie peut être faite, et peut-elle livrer l'énorme valeur que nous voyons aujourd'hui ?
Je continue à revenir à ces preuves les plus directes. Comme l'ingénierie logicielle — si vous n'êtes pas un ingénieur logiciel, si vous n'avez pas vraiment utilisé Codex, il est difficile de comprendre la différence d'expérience à travers la lecture. Cette différence est en fait difficile à décrire. Mais je pense que les gens le sentiront bientôt vraiment.
Il y a six mois, ce genre d'expérience palpable était principalement interne à nous ; plus tard, il y a eu des preuves externes claires aussi. Et dans six mois, je pense que tout le monde le sentira. Et d'ici là, nous sentirons tous un autre genre de douleur : il y a de grands modèles là-bas, mais vous ne pouvez pas les utiliser parce qu'il n'y a tout simplement pas assez de calcul dans le monde.
Alex :
Oui, mais quand nous faisions des prédictions pour 2026 dans l'émission, il y avait une discussion à la fin de l'année dernière. Ranjan Roy était aussi là, et il a dit que 2026 serait l'année de « tout le monde utilisant un agent intelligent ». Ma réaction à l'époque était : je le croirai quand je le verrai de mes propres yeux et quand je commencerai réellement à utiliser un agent intelligent moi-même.
Greg Brockman :
Alors maintenant, n'avons-nous pas atteint ce moment ? À quoi l'utilisez-vous maintenant ?
Alex :
Je l'utilise pour construire des outils internes pour aider les gens avec qui je travaille à mieux se synchroniser quand les vidéos vont en ligne, comment les miniatures devraient être faites, et des choses comme ça. Je tire aussi des données de YouTube pour que nous puissions analyser la performance vidéo basée sur des facteurs tels que les miniatures. Dans une certaine mesure, c'est un ensemble de logiciels que j'ai personnalisés moi-même, et si fait de manière traditionnelle, je ne dépenserais probablement pas d'argent pour l'acheter du tout.
Je pense que c'est ce qui le rend intéressant en ce moment : le logiciel était à l'origine produit à une échelle de masse pour le grand public, mais précisément à cause de cela, il y a toujours beaucoup d'endroits dedans qui ne sont pas adaptés à vous. Et peut-être que le changement apporté par l'IA est qu'il nous permet enfin d'interagir avec le logiciel d'une manière plus naturelle.
Greg Brockman :
Je pense que c'est la clé. Et une chose à laquelle j'ai constamment pensé est : la façon dont nous construisons les ordinateurs aujourd'hui nous tire en fait dans un monde numérique.
Pensez à combien de temps vous passez à faire défiler constamment du contenu sur votre téléphone. Puis pensez à combien de temps vous passez à cliquer continuellement sur divers boutons, essayant de connecter ce système à ce système — pourquoi ces choses doivent-elles être faites par vous-même ? Ce que l'IA devrait vraiment faire est de rapprocher la machine de vous, la rendant plus adaptée à vous, et plus compréhensive de ce que vous voulez accomplir.
Cette idée a toujours fait partie de notre culture pop : vous pouvez parler directement à l'ordinateur, et ensuite il fait avancer les choses pour vous. Et maintenant, cette chose commence à devenir une réalité, devenant vraiment quelque chose que vous pouvez faire. L'étendue de ce changement est vraiment incroyable, et beaucoup de fois vous devez l'essayer vous-même pour vraiment le comprendre. Donc je sens vraiment que nous sommes dans un moment très spécial.
Alex :
Alors je me demande, pourquoi la perception publique de l'IA est-elle si négative ? Par exemple, les données YouGov montrent qu'aux États-Unis, trois fois plus de personnes croient que l'IA aura un impact négatif sur la société par rapport à ceux qui croient qu'elle aura un impact positif.
Quelle pensez-vous être la raison derrière cela ? Êtes-vous inquiet de l'image publique de l'IA ?
Greg Brockman :
Je pense qu'une chose que nous devons vraiment faire est : montrer aux gens de ce pays pourquoi l'IA est bénéfique pour eux. Et pas juste d'un point de vue macroéconomique, pas juste dire qu'elle conduira la croissance du PIB et d'autres grands mots comme ça, mais : comment elle améliore réellement spécifiquement leur vie.
En fait, j'entends des histoires très spécifiques chaque jour. Par exemple, il y a une famille dont l'enfant a eu des maux de tête constants et quelques autres problèmes de santé, mais leur scan IRM n'a pas été approuvé. Plus tard, ils ont utilisé ChatGPT pour rechercher les symptômes et ont réalisé qu'ils pouvaient en fait utiliser cela pour faire un cas plus fort auprès de la compagnie d'assurance. Ils l'ont fait, et il s'est avéré que l'enfant avait effectivement une tumeur dans son cerveau. Et c'était parce qu'ils ont obtenu la bonne information à travers ChatGPT que la vie de l'enfant a été sauvée.
C'est juste une histoire. Il y a beaucoup, beaucoup d'histoires similaires. La vie des gens a été profondément améliorée par cette technologie, et certains ont même été sauvés par elle. La clé est qu'ils se sont vraiment engagés avec cette technologie dans la vraie vie.
Mais j'ai l'impression que ces types d'histoires n'ont pas vraiment été largement partagées. Je pense que cela se produit dans la vie de beaucoup de gens, mais pour une raison quelconque, ce n'est pas vraiment devenu un récit dominant encore.
J'ai aussi remarqué que la culture populaire, surtout l'imagination qui a persisté depuis les années 1990, est très négative à propos de l'IA, soulignant toujours ce qui pourrait mal tourner. Mais une fois que les gens commencent réellement à utiliser l'IA, ils trouvent qu'elle a une valeur pratique, qu'elle est utile.
Donc je me soucie beaucoup de cela : nous n'avons pas vraiment réussi à aider les gens à comprendre pourquoi cette vague de technologie améliorera leur vie, pourquoi elle favorisera des connexions plus étroites entre les êtres humains.
C'est un accent très important pour moi. Et si vous élargissez votre perspective un peu pour voir pourquoi l'IA est si importante, je pense qu'elle deviendra une source significative de puissance économique et de sécurité nationale à l'avenir. Elle affectera la compétitivité d'un pays. Et d'autres pays comme la Chine ont montré une direction presque complètement opposée dans l'IA.
Donc, oui, je pense que c'est très important. Nous devons y faire face, et nous devons vraiment comprendre comment s'assurer que tout le monde peut bénéficier des avantages de cette technologie.
Alex :
Mais nous sommes aussi dans un moment extrêmement instable en ce moment. Les gens sont très inquiets à propos des emplois. Chaque fois que je parle à quelqu'un à propos de l'IA, ils demandent presque toujours : combien de temps puis-je garder mon emploi ?
Et puis quand il s'agit de centres de données, la perception du public à leur égard est encore pire que celle de l'IA elle-même. Si vous regardez ces sondages d'opinion publique, vous constaterez que plus de gens croient que les centres de données auront un impact négatif sur l'environnement, les coûts énergétiques domestiques, et la qualité de vie des résidents environnants, plutôt qu'un impact positif.
Donc nous nous trouvons à un moment où les bons emplois sont de plus en plus difficiles à trouver, et les gens voient des centres de données arriver dans leur communauté et pensent, « Cette chose n'est ni respectueuse de l'environnement ni rentable en termes d'énergie, et elle abaissera notre qualité de vie. »
Ont-ils tort ?
Greg Brockman :
Je pense qu'il y a en effet beaucoup de désinformation entourant les centres de données.
Un exemple très typique est le problème de l'utilisation de l'eau. Si vous allez réellement voir notre installation à Abilene, qui est la plus grande du monde, ou au moins l'une des plus grandes, installations de supercalcul, sa consommation totale annuelle d'eau est en fait équivalente à celle d'un ménage moyen pour une année. En d'autres termes, l'utilisation de l'eau est en fait minimale.
Mais il y a beaucoup de désinformation là-bas qui amène les gens à croire que ces centres de données consomment une grande quantité de ressources en eau.
L'électricité est une situation similaire. Nous nous sommes engagés à supporter les coûts nous-mêmes et à ne pas passer la pression de la hausse des prix de l'électricité aux résidents. C'est important, et maintenant l'industrie entière commence à prendre des engagements similaires parce qu'améliorer la communauté locale est en effet très important. Et quand nous construisons un centre de données, nous nous engageons aussi vraiment avec ces communautés locales pour comprendre ce qui se passe localement et ce que nous pouvons faire pour aider. Les centres de données apportent des revenus fiscaux et créent des emplois. Cela apporte beaucoup d'avantages.
Donc je pense que la clé est toujours comment nous nous montrons, et c'est une responsabilité que nous prenons très au sérieux.
Alex :
D'accord, mais si les factures d'électricité des résidents n'augmentent pas, vous devez toujours apporter de l'électricité, ce qui peut signifier plus de pollution. N'est-ce pas un problème ?
Greg Brockman :
Je pense qu'il y a en fait beaucoup de couches plus fines à cela.
Si vous regardez comment le réseau électrique fonctionne aujourd'hui, vous constaterez qu'il y a en fait beaucoup d'« électricité oisive » — c'est-à-dire, beaucoup d'énergie est déjà là mais pas pleinement utilisée. En même temps, le système de transmission lui-même a besoin de mise à niveau. Et la clé est que ces coûts de mise à niveau devraient être supportés par nous, pas par les contribuables ordinaires, ce qui est très important. Il y a beaucoup d'endroits où il y a de l'énergie propre disponible, mais cette énergie n'est en fait pas pleinement utilisée et est même gaspillée dans une certaine mesure.
Donc, quand la demande des centres de données arrive, elle apporte en fait un élan réel pour mettre à niveau ces réseaux vieillissants et obsolètes. Et cette mise à niveau, en fait, apporte aussi des avantages réels à la communauté. Par exemple, dans le Dakota du Nord, nous avons vu que la construction d'un centre de données local a en fait aidé à améliorer l'infrastructure des services publics, résultant en une baisse des prix de l'électricité résidentielle.
Alex :
D'accord, une dernière question politique. Vous avez fait un don de 25 millions de dollars à MAGA Inc., qui est un comité d'action politique soutenant Trump.
Greg Brockman :
Vous en avez discuté avec Kara avant aussi.
NOTE : Kara Swisher, une journaliste technologique américaine proéminente, connue pour ses questions pointues et son style direct, a longtemps couvert la Silicon Valley et les entreprises internet.
Alex :
D'accord. Vous avez dit à l'époque, « Tout ce qui aide cette technologie à vraiment bénéficier à tout le monde, je le ferai. » Si cela fait de vous un « électeur à enjeu unique » ou un « donateur à enjeu unique », qu'il en soit ainsi. Mais ce que je me suis toujours demandé est : pour ce genre de « camp à enjeu unique », l'étoile polaire ultime de toute action politique ne devrait-elle pas être « rendre ce pays plus fort » lui-même ?
En d'autres termes, même si un candidat ne soutient pas pleinement ce que vous faites, s'il peut rendre ce pays plus fort, cela ne devrait-il pas aussi être un critère clé pour le soutien politique ? Si oui, cela fait-il aussi partie de votre considération de don ?
Greg Brockman :
C'est ainsi que je le vois : ce don était une décision que ma femme et moi avons prise ensemble. Nous avons aussi fait des dons à des super PACs des deux côtés de l'allée.
Je sens que cette technologie arrive très vite. Au cours des prochaines années, elle changera vraiment tout et deviendra le fondement de l'économie entière. Mais elle n'est pas populaire encore. Donc nous voulons beaucoup soutenir ces figures politiques qui sont vraiment prêtes à embrasser cette technologie, qui comprennent vraiment cette technologie.
Bien sûr, à un niveau plus large, cette technologie elle-même améliore en fait les capacités de notre pays. Dans un sens, je suis en effet un « électeur à enjeu unique » parce que je crois que c'est le domaine où je peux apporter une contribution unique. Mais finalement, cela exprime toujours un soutien : en tant que pays, nous devrions embrasser proactivement cette technologie.
Compétence de base future : pas utiliser l'IA, mais « gérer l'IA »
Alex :
S'il y a quelqu'un assis devant vous en ce moment qui a très peur de l'IA, pensant que l'IA prendra son emploi, ruinera sa communauté, changera le monde trop vite, que leur diriez-vous ?
Greg Brockman :
La chose que je veux le plus dire est : allez essayer ces outils par vous-même. Parce que seulement quand vous aurez vraiment fait l'expérience de l'IA qui existe déjà aujourd'hui, vous comprendrez vraiment ce qu'elle peut faire pour vous.
Et aujourd'hui, nous avons déjà vu trop d'opportunités, de potentiels, et d'autonomisations de cette technologie. Vous venez de dire ce que vous pouvez faire avec maintenant, n'est-ce pas ? Les gens qui n'ont jamais fait un site web avant peuvent maintenant en faire un ; si vous voulez démarrer une petite entreprise, auparavant vous auriez peut-être été submergé par divers processus backend et détails opérationnels, mais maintenant l'IA peut vous aider avec beaucoup de ces choses.
Donc je pense, pour votre propre vie, vous devriez penser à : peut-elle vous aider à gérer votre santé ? Peut-elle vous aider à prendre soin de vos proches ? Peut-elle vous aider à gagner de l'argent ? Peut-elle vous aider à économiser de l'argent ? Toutes ces choses seront des options réelles.
Je pense que les gens trouvent toujours plus facile de voir « ce qui changera » mais pas si facile de voir « ce qu'ils gagneront ». Cependant, je crois que cela vaut la peine de lui donner une chance équitable, pour comprendre vraiment ce que chaque côté de la balance représente vraiment.
Alex :
Au fait, c'est aussi un point qui est rarement discuté dans les sondages. Ceux qui ont seulement « entendu parler de l'IA » mais ne l'ont jamais vraiment utilisée eux-mêmes, ou ont à peine utilisé l'IA, ont tendance à être plus négatifs. Une fois que vous devenez un utilisateur intensif, ou même juste un utilisateur régulier, votre vue de cette technologie est généralement beaucoup plus positive.
Greg Brockman :
Pour moi personnellement, nous avons pensé à cette technologie pendant de nombreuses années. Et maintenant, la façon dont je vois la réalité se dérouler est encore plus étonnante et bénéfique que nous n'aurions jamais imaginé, et elle aura un impact beaucoup plus positif que nous ne l'attendions.
Alex :
Une dernière question. Si quelqu'un vous demande, « Comment devrais-je me préparer pour l'avenir ? » comment répondriez-vous ?
Et cette réponse ne peut pas être juste « allez utiliser un outil ». Parce que j'ai vraiment des amis qui viennent me voir et me demandent, « Je ne sais pas ce qui arrivera à mon emploi, je ne sais pas ce qui arrivera à ce monde, je veux juste savoir quoi faire maintenant. »
Greg Brockman :
Je pense toujours que la première chose est de comprendre cette technologie. Nous avons vu que ceux qui bénéficient vraiment le plus de cette technologie sont souvent ceux qui l'abordent avec curiosité. Ils l'intégreront vraiment dans leur flux de travail, feront un effort pour surmonter le seuil initial — face à une boîte de saisie vide et ce sentiment de « que devrais-je même faire avec elle ».
Vous devez cultiver progressivement un sens de l'agence : je peux être un manager ; je peux définir des directions ; je peux déléguer des tâches ; je peux superviser. Et vous devez vraiment développer cette capacité parce qu'elle deviendra une compétence très fondamentale.
Nous construisons cette technologie pour aider l'humanité, pour promouvoir plus de connexions entre les humains, pour donner aux gens plus de temps pour faire ce qu'ils veulent vraiment faire. Donc, la question deviendra finalement : que voulez-vous vraiment ? Et la chose vraiment importante est de clarifier cela et d'utiliser cette technologie pour l'atteindre.
Alex :
C'est vrai. Merci beaucoup d'être venu dans l'émission.
Greg Brockman :
Merci pour l'invitation.
Alex :
Aussi, merci à tous d'avoir écouté et regardé. À la prochaine fois sur le Big Technology Podcast.
Vous pourriez aussi aimer

Rapport du matin | Coinbase Ventures réalise son premier investissement dans ENA ; SpaceX prévoit de fixer le prix de son introduction en bourse à 135 $ par action

Texte intégral et analyse du discours du PDG de SanDisk lors de la 42e conférence annuelle sur les décisions stratégiques de Bernstein

Prévision du prix du Bitcoin pour 2030 : Ark Invest anticipe 710 000 $

Prix du SOL aujourd'hui : cours en direct de Solana, graphiques et données de marché

Qu'est-ce qu'un ETF Bitcoin : Spot vs Futures expliqués

Pourquoi le Bitcoin chute de 15 % alors que le Nasdaq atteint des records ?
Qu'est-ce que la TradFi et pourquoi tout le monde en parle en 2026 ?

Rapport du matin | Strategy a vendu 32 BTC et plus de 800 000 actions MSTR la semaine dernière ; Binance a officiellement annoncé son portail de trading d'actions américaines ; Polymarket a conclu un partenariat exclusif avec OneFootball

Bootcamp de trading WEEXPERIENCE en Pologne : comment WEEX et FireCrew rendent le trading crypto accessible à tous

Le sacre de Paris : comment le PSG a brisé le rêve d'Arsenal lors d'une finale de Ligue des champions historique

TaiJi finalise un financement stratégique de 3,5 millions de dollars, avec la participation de Castrum Capital, Becker Ventures et Coinvestor Ventures

Bitcoin stagne près de 73 000 $ ? Comment les traders trouvent des opportunités dans un marché latéral en juin

Comment staker Solana : un guide étape par étape pour 2026

Le prix garanti est désormais disponible sur WEEX : exécutez vos ordres avec une plus grande précision

Dernières recherches de la BRI : L'avenir des stablecoins et le paysage monétaire mondial

Entretien avec l'expert macro Raoul Pal : La course à l'IA mène à une « singularité économique », ne lâchez pas vos jetons trop facilement au cours des quatre prochaines années

Pourquoi Peter Thiel, l'homme derrière Palantir, prépare-t-il une sortie en Argentine ?






