La última entrevista del cofundador de OpenAI: ¿Qué le espera a ChatGPT tras el cierre de Sora?
Título del vídeo: Greg Brockman, presidente de OpenAI: Estrategia de IA, AGI y la Super App
Autor del vídeo: Alex Kantrowitz
Traducción: Peggy, BlockBeats
Nota del editor: Este artículo es una traducción de una conversación con Greg Brockman, presidente y cofundador de OpenAI, en el podcast Big Technology. El programa se ha centrado durante mucho tiempo en los cambios en la IA, la industria tecnológica y la estructura empresarial, sirviendo como una ventana importante a las observaciones de primera línea en Silicon Valley.

En esta conversación, Brockman no se detuvo en la capacidad del modelo en sí, sino que llevó la pregunta más allá: dado que las capacidades de la IA han sido ampliamente validadas, ¿cómo elegirá la industria su camino, rediseñará sus productos y absorberá el impacto sistémico que conlleva? La conversación gira en torno a la estrategia de producto de OpenAI, la próxima "Super App" y su valoración sobre la entrada de la IA en la "fase de despegue".
Esta conversación puede entenderse desde tres aspectos.
Primero, convergencia de caminos.
Desde la generación de vídeo hasta los modelos de inferencia, desde el progreso en múltiples líneas hasta las decisiones activas, las elecciones de OpenAI no son un simple juicio de superioridad técnica, sino una respuesta a las limitaciones del mundo real: la potencia de cálculo se ha convertido en un cuello de botella fundamental. Con recursos limitados, la hoja de ruta técnica está empezando a converger en dos direcciones de gran apalancamiento: asistentes personales y resolución de problemas complejos. Esto también significa que la lógica competitiva de la IA está pasando de "qué se puede hacer" a "qué hacer primero".
Segundo, reconstrucción de formas.
La propuesta de la "Super App" es, fundamentalmente, un salto en la forma del producto. La IA ya no es una colección de herramientas dispersas, sino un punto de entrada unificado: comprende el contexto, utiliza herramientas, realiza tareas y acumula memoria continuamente en diferentes escenarios. De ChatGPT a Codex, la IA está asumiendo gradualmente flujos de trabajo completos, y el papel humano también está cambiando de ejecutor a programador: establecer objetivos, asignar tareas y supervisar.
Tercero, inflexión del ritmo.
Si los últimos dos años fueron una etapa de escalada de capacidades, lo que está ocurriendo ahora es un "despegue". Por un lado, las capacidades de los modelos han pasado de "ayudar en un 20% del trabajo" a "cubrir cerca del 80% de las tareas", lo que desencadena directamente una reestructuración de los flujos de trabajo; por otro lado, la IA está participando en su propia evolución (usar IA para optimizar la IA), superponiendo chips, aplicaciones y coordinación empresarial para formar un círculo cerrado que se acelera continuamente. La IA ya no es una tecnología de punto único, sino que está empezando a convertirse en un motor clave que impulsa el crecimiento económico.
Sin embargo, al mismo tiempo, está surgiendo otro conjunto de problemas de forma sincronizada: la desconfianza pública, la incertidumbre laboral, la controversia en torno a los centros de datos y los límites de la seguridad y la gobernanza. En respuesta, la respuesta de Brockman no es puramente interna a la tecnología. Destaca dos puntos: primero, los riesgos no pueden abordarse mediante un "control centralizado", sino que requieren el establecimiento de una infraestructura social en torno a la IA similar al sistema eléctrico; segundo, las capacidades individuales están experimentando una transformación: la pregunta crucial ya no es "¿puedes usar la herramienta?", sino "¿puedes lograr tus objetivos con la IA?".
Si la pregunta anterior era "¿qué puede hacer la IA?", la pregunta actual ha cambiado a qué necesitas hacer cuando la IA empieza a hacer la mayor parte de las cosas por ti.
A continuación, el texto original (ligeramente editado para facilitar la lectura):
Resumen (TL;DR)
La AGI ha entrado en la etapa de "camino claro": Greg Brockman (cofundador de OpenAI) cree que, basándose en el modelo de razonamiento de GPT, ahora existe un camino claro hacia la AGI, que se espera alcanzar en unos pocos años, aunque la forma seguirá siendo "irregular".
Nota: AGI (Inteligencia Artificial General) se refiere a la inteligencia artificial general, lo que significa sistemas de IA que poseen capacidades equivalentes o incluso superiores a las humanas en la mayoría de las tareas cognitivas. A diferencia de la actual "IA estrecha" (como el reconocimiento de imágenes o los algoritmos de recomendación), la AGI enfatiza la generalidad y la transferibilidad entre tareas.
Convergencia estratégica: de la exploración multilínea a dos aplicaciones principales: Bajo las limitaciones computacionales, OpenAI está concentrando recursos en "asistentes personales" y "resolución de problemas complejos", en lugar de avanzar en todas las direcciones simultáneamente (como la generación de vídeo).
Las "Super Apps" se convertirán en la forma de entrada de la IA: El chat, la programación, la navegación y el trabajo de conocimiento se integrarán en un sistema unificado, haciendo que la IA pase de ser una herramienta a una "capa de ejecución", con los usuarios convirtiéndose en "despachadores".
Cambio fundamental: la IA comienza a asumir flujos de trabajo en lugar de solo asistir: La capacidad del modelo ha aumentado de "completar el 20% de las tareas" a "manejar el 80%", obligando a individuos y empresas a reestructurar cómo se realiza el trabajo.
La potencia de cálculo se convierte en el cuello de botella central y el foco competitivo: La demanda de IA supera con creces la oferta, y la limitación futura no radica en la capacidad del modelo, sino en los recursos de cómputo, lo que convierte a los centros de datos y la infraestructura en variables críticas.
El "despegue" de la IA está ocurriendo: La tecnología que se autoevalúa (IA optimizando IA) combinada con la sinergia industrial (chips, aplicaciones, empresas) está impulsando a la IA de ser una herramienta a ser un motor de crecimiento económico.
El mayor riesgo no reside en la tecnología, sino en la gobernanza y el uso: Los problemas de seguridad no pueden ser resueltos por una sola entidad; un ecosistema abierto y una infraestructura social deben asumir la responsabilidad conjuntamente.
La capacidad individual central se está transformando: La competitividad futura no reside en la "ejecución", sino en "establecer objetivos + gestionar sistemas de IA"; usar la IA de forma proactiva se convertirá en una habilidad fundamental.
Resumen de la entrevista:
Alex (Anfitrión):
Hoy nos acompaña Greg Brockman, cofundador y presidente de OpenAI, para hablar sobre las oportunidades más prometedoras en IA, cómo planea OpenAI aprovechar estas oportunidades y el concepto de "super apps". Greg está hoy aquí en nuestro estudio de grabación.
Greg Brockman (Cofundador y presidente de OpenAI):
Es un placer verte, gracias por invitarme.
¿Por qué cerrar Sora? Potencia de cálculo insuficiente
Alex:
En este momento, OpenAI está pausando el avance de la generación de vídeo para concentrar recursos en una "super app" que integrará escenarios de negocio y programación. Externamente (incluyéndome a mí), parece que OpenAI ya ha tomado la delantera en el sector de consumo, pero ahora está reasignando recursos. ¿Qué está pasando?
Nota: En marzo de 2026, OpenAI anunció el cierre de su producto de generación de vídeo Sora (incluyendo la aplicación y la API) y detuvo los esfuerzos comerciales relacionados.
Greg Brockman:
Durante el último periodo, hemos estado desarrollando esta tecnología de aprendizaje profundo, con el objetivo de validar si realmente puede ofrecer el impacto positivo que siempre hemos imaginado, si puede utilizarse para construir aplicaciones que realmente ayuden a las personas y mejoren sus vidas.
Al mismo tiempo, también hemos estado siguiendo otro camino: desplegar esta tecnología. Por un lado, esto es para apoyar las operaciones comerciales y, por otro, para acumular experiencia en el mundo real desde el principio, preparándonos para el momento en que la tecnología realmente madure.
Y ahora, hemos llegado a una nueva etapa. Vemos que esta tecnología es realmente viable. Estamos pasando de la "evaluación comparativa" y algunas demostraciones de capacidad bastante abstractas a una nueva fase: debemos ponerla en el mundo real, hacer que participe en el trabajo real y seguir evolucionando a través de los comentarios de los usuarios.
Así que me inclino más a entender este cambio como: un cambio estratégico impulsado por un cambio de fase tecnológica.
Esto no quiere decir que estemos pasando del "sector de consumo" al "sector empresarial". Más exactamente, nos estamos haciendo una pregunta: en una situación de recursos limitados, ¿qué aplicaciones deberíamos priorizar más? Porque no podemos hacerlo todo.
¿Qué aplicaciones pueden implementarse realmente, colaborar entre sí y generar un impacto en el mundo real? Si enumeras todas las direcciones, el sector de consumo se puede dividir en muchos tipos: como un asistente personal, un sistema que realmente te entienda, se alinee con tus objetivos y te ayude a lograr tus metas vitales; así como la creación y el entretenimiento, y muchas otras posibilidades. En el sector empresarial, si miras desde un nivel superior, en realidad se puede abstraer en una sola cosa: tienes una tarea compleja, ¿puede la IA ayudarte a completarla?
Para nosotros, la prioridad actual es muy clara, con solo dos cosas en primer plano: primero, un asistente personal; segundo, una IA que pueda ayudarte a resolver problemas complejos.
El problema es: con nuestra potencia de cálculo actual, ni siquiera podemos soportar completamente estas dos cosas. Una vez que añades más escenarios de aplicación, es simplemente imposible cubrirlos todos. Así que esto es en realidad una prueba de realidad: la tecnología está madurando rápidamente, el impacto está a punto de explotar y debemos tomar decisiones, seleccionar la dirección más importante para darle vida realmente.
Alex:
Mencionaste una metáfora antes, diciendo que OpenAI es un poco como Disney: tiene una capacidad central y luego puede expandirse a diferentes escenarios. Disney tiene a Mickey Mouse, que se puede usar en películas, parques temáticos, Disney+. El "núcleo" de OpenAI es el modelo, que se puede usar para generación de vídeo, como asistente, para aplicaciones empresariales.
Pero ahora, parece que ya no estás tomando este camino de "expansión integral", sino que tienes que tomar decisiones. ¿Es eso correcto?
Greg Brockman:
En realidad, creo que esta metáfora es aún más aplicable ahora. Pero el punto clave es: técnicamente, Sora (modelo de vídeo) y GPT (modelo de inferencia) pertenecen en realidad a dos ramas técnicas diferentes. La forma en que están construidos es completamente diferente.
El problema es que, en la etapa actual, avanzar en ambas ramas técnicas simultáneamente es muy difícil, especialmente con recursos limitados. Así que la elección que hemos hecho es concentrar los recursos principales en el camino de GPT en esta etapa.
Por supuesto, esto no significa que estemos renunciando a otras direcciones. Por ejemplo, en el campo de la robótica, seguimos realizando investigaciones relevantes. Pero la robótica en sí misma todavía está en sus primeras etapas y aún no ha entrado en una etapa de madurez verdaderamente explosiva.
Por otro lado, en el próximo año, veremos a la IA despegar realmente en el dominio del trabajo de conocimiento.
Y es importante enfatizar: el camino de GPT no es solo sobre "texto". Por ejemplo, la interacción de voz bidireccional (voz a voz) también es parte de este camino técnico, haciendo que la IA sea más accesible y práctica. Estas capacidades están esencialmente dentro del mismo marco de modelo, ajustadas de diferentes maneras.
Sin embargo, si sigues dos ramas técnicas completamente diferentes, es difícil sostenerlo a largo plazo con una potencia de cálculo limitada. La potencia de cálculo es limitada porque la demanda es demasiado alta. Casi después de cada lanzamiento de modelo, la gente quiere hacer más con él.
Alex:
Entonces, ¿por qué no te centraste en el camino del "Modelo del Mundo"? Por ejemplo, un modelo de vídeo que necesita entender la relación entre los objetos, lo cual también es crucial para la robótica. Además, el progreso de Sora ha sido muy rápido. ¿Por qué finalmente elegiste apostar por GPT?
Nota: El "Modelo del Mundo" se centra en la percepción y la intuición física, con la idea central de permitir que la IA entienda "cómo funciona el mundo", no solo aprender "patrones superficiales de datos". Estos modelos se utilizan a menudo para describir sistemas como Sora: no solo generan imágenes o vídeos, sino que también modelan las relaciones entre objetos (como humanos, coches, luz), los cambios continuos en el tiempo (evolución entre fotogramas) y las leyes físicas básicas (como el movimiento, la oclusión y la colisión). Por el contrario, GPT pertenece a los modelos de lenguaje y razonamiento, más centrados en la cognición abstracta y la capacidad de ejecución de tareas.
Greg Brockman:
El mayor problema en este campo es, en realidad, que hay demasiadas oportunidades.
Descubrimos desde el principio en OpenAI que, siempre que una idea sea matemáticamente sólida, suele funcionar y puede lograr buenos resultados. Esto demuestra el poder subyacente del aprendizaje profundo, que puede abstraer reglas de generación a partir de datos y transferirlas a nuevos escenarios. Esto se puede aplicar a varios campos como modelos del mundo, descubrimientos científicos y programación.
Pero la clave es: necesitamos tomar decisiones.
Siempre ha habido un debate sobre hasta dónde pueden llegar los modelos de texto. ¿Pueden realmente entender el mundo? Creo que ahora tenemos la respuesta a esta pregunta: los modelos de texto pueden alcanzar la AGI.
Hemos visto un camino claro, y este año surgirán modelos aún más fuertes. Internamente en OpenAI, uno de nuestros mayores dolores de cabeza es cómo asignar la potencia de cálculo; este problema solo empeorará, no mejorará. Así que, fundamentalmente, no es una cuestión de "qué camino es más importante", sino una cuestión de tiempo y secuencia.
Ahora, algunas aplicaciones que antes pensábamos que estaban lejos están empezando a estar al alcance. Por ejemplo, resolver problemas de física no resueltos. Recientemente tuvimos un caso en el que un físico había estado estudiando un problema durante mucho tiempo, le entregó el problema a un modelo y, 12 horas después, teníamos una solución. Dijo que era la primera vez que sentía que un modelo estaba "pensando". Este problema puede ser incluso uno que los humanos nunca puedan resolver, pero la IA sí lo hizo.
Cuando ves algo así, tu única opción es redoblar, triplicar la apuesta. Porque significa que realmente podemos liberar un potencial tremendo.
Así que, para mí, esto no es una competencia entre diferentes direcciones, sino más bien: ¿cuál es la misión de OpenAI? ¿Cómo llevamos la AGI al mundo? ¿Cómo hacemos que sea verdaderamente beneficiosa para todos? Y hemos visto ese camino, sabemos cómo avanzar en él.
Apostar por GPT en lugar de los Modelos del Mundo: un camino hacia la AGI
Alex:
Bueno, quiero volver a los modelos de próxima generación que mencionaste antes, pero quiero seguir con esta pregunta primero.
A principios de este año, tuve una charla con Demis Hassabis de Google DeepMind. Curiosamente, dijo que para él, lo más parecido a la AGI era en realidad su generador de imágenes llamado Nano Banana.
Nota: Demis Hassabis es una de las figuras clave que impulsa la IA desde la investigación hasta las aplicaciones innovadoras. Cofundó DeepMind, que desarrolló AlphaGo y derrotó al campeón mundial de Go en 2016, un evento histórico en la historia del desarrollo de la IA.
Su razonamiento era: ya sea un generador de imágenes o un generador de vídeo, para generar tales imágenes y vídeos, fundamentalmente, debes entender la interacción entre los objetos, al menos tener cierto nivel de comprensión de cómo funciona el mundo.
Entonces, ¿esto implica un riesgo potencial? ¿Es esta una gran apuesta? Si ese es el caso, ¿seguirá OpenAI redoblando la apuesta en otra rama de la tecnología y se perderá algo?
Greg Brockman:
¿Si ese es realmente el caso? Tengo dos respuestas.
Primero, por supuesto, es una posibilidad. Así es este campo; al final tienes que tomar decisiones, tienes que apostar. Y OpenAI ha estado haciendo esto desde el principio: tenemos que evaluar, creer en el camino hacia la AGI y luego avanzar con gran enfoque a lo largo de ese camino. Al igual que sumar vectores aleatorios, el resultado puede terminar siendo cercano a cero; pero si alineas todos los vectores, pueden impulsarte claramente en una dirección.
Sin embargo, el segundo punto es que la generación de imágenes es en realidad también una capacidad muy popular en ChatGPT, y seguimos invirtiendo y priorizando continuamente el avance en esta área. La razón por la que podemos hacer esto es que en realidad no pertenece a la rama técnica del "modelo del mundo" o "modelo de difusión"; en realidad está construido sobre la arquitectura GPT. Así que, aunque se enfrenta a una distribución de datos diferente, a un nivel de tecnología central más fundamental, sigue siendo lo mismo.
Y esto es precisamente una de las cosas más asombrosas de la AGI: a veces, aplicaciones que parecen muy diferentes (como la interacción de voz a voz, la generación de imágenes, el procesamiento de texto y la aplicación del texto en varios escenarios como la investigación científica, la programación, la información de salud personal y más) pueden acomodarse dentro del mismo marco técnico.
Así que, desde una perspectiva técnica, una cosa en la que yo y la empresa siempre hemos estado pensando es cómo unificar nuestros esfuerzos tanto como sea posible. Porque realmente creemos que esta tecnología traerá una mejora integral y puede incluso elevar todo el sistema económico.
Y la escala de esto es demasiado vasta. Ciertamente no podemos hacerlo todo, pero podemos completar nuestra parte.
Alex:
Esto es lo que significa esa "general" en Inteligencia Artificial General (AGI).
Greg Brockman:
Exactamente, esa es la "G", eso es realmente lo que significa.
Alex:
Hablando de "unificación", ¿cómo será esta super app al final?
Greg Brockman:
La super app tal como yo la veo...
Alex:
Integrará chat, programación, navegación y cosas como ChatGPT, todo junto, ¿verdad?
Greg Brockman:
Sí. Lo que queremos crear es una aplicación orientada al usuario final que le permita experimentar verdaderamente el poder de la AGI, es decir, su "generalidad".
Si piensas en los productos de chat de hoy, creo que evolucionarán gradualmente hacia tu asistente personal, tu API personal, una IA verdaderamente considerada contigo. Sabe mucho sobre ti, se alinea con tus objetivos, es confiable y puede, hasta cierto punto, "representarte" en este mundo digital.
En cuanto a Codex, puedes pensar en ello como: actualmente es una herramienta construida principalmente para ingenieros de software, pero está evolucionando hacia un "Codex para todos".
Cualquiera que quiera crear o construir algo puede usar Codex para hacer que la computadora haga lo que quiere. Y ya no se trata solo de "escribir software"; es más como "usar la computadora" en sí misma. Por ejemplo, hago que me ayude a ajustar la configuración de mi portátil. A veces olvido cómo configurar las esquinas activas, así que simplemente hago que Codex lo haga, y realmente lo hace.
Así es como debería ser una computadora naturalmente; debería adaptarse a las personas, no obligarme a mí a adaptarme a ella.
Así que puedes imaginar una aplicación como esta: cualquier cosa que quieras que haga la computadora, puedes decírselo directamente. Incluirá la capacidad de "usar la computadora" y "navegar por la web", permitiendo que la IA opere realmente las páginas web, y también puedes supervisar lo que está haciendo. Además, ya sea que tu interacción sea a través de chat, codificación o trabajo de conocimiento general, todas estas conversaciones se unificarán en un solo sistema. La IA tendrá memoria y te entenderá.
Esto es lo que estamos construyendo.
Pero para ser honesto, esto es solo la punta del iceberg, la parte que es visible sobre el agua. Para mí, lo que es verdaderamente más importante es la unificación de la tecnología subyacente.
Hemos mencionado la unificación a nivel de modelos subyacentes, pero lo que realmente ha cambiado en los últimos años es esto: ya no se trata solo del "modelo" en sí; lo que es más crucial es el "sistema de despliegue". En otras palabras, ¿cómo obtienen contexto los modelos? ¿Cómo se conectan al mundo real? ¿Qué acciones pueden tomar? ¿Cómo opera el bucle de retroalimentación con los usuarios a medida que surgen continuamente nuevos contextos?
Internamente, en el pasado, en realidad teníamos múltiples implementaciones de estas cosas, o al menos unas pocas implementaciones ligeramente diferentes. Ahora las estamos consolidando en una sola. En última instancia, tendremos una capa de IA unificada y luego, de una manera muy ligera, la dirigiremos a diferentes casos de uso específicos.
Por supuesto, todavía puedes crear un pequeño plugin, una pequeña interfaz, específicamente para finanzas o derecho, pero en la mayoría de los casos, es posible que ni siquiera lo necesites porque esta super app en sí misma será lo suficientemente amplia y genérica.
Alex:
¿Está esta aplicación orientada tanto a casos de uso empresariales como personales?
Greg Brockman:
Sí, ese es en realidad su núcleo. Al igual que una computadora, como tu portátil, ¿es para uso personal o laboral? La respuesta es ambos. Es principalmente tu dispositivo, tu interfaz con el mundo digital. Y eso es exactamente lo que queremos lograr.
Alex:
Entonces, desde una perspectiva no empresarial, si uso esta super app en mi vida personal, ¿para qué la usaría? ¿Cómo cambiaría mi vida?
Greg Brockman:
Mi comprensión sería esta: en tu vida personal, comenzará extendiendo cómo usas actualmente ChatGPT.
¿Cómo usas actualmente ChatGPT? La gente ya lo está usando para realizar una amplia variedad de tareas asombrosas. A veces es tan simple como decir: "Necesito ayuda para redactar un discurso para una boda, ¿puedes ayudarme?" o "¿Puedes echar un vistazo a esta idea y darme algunos comentarios?". O incluso: "Dirijo una pequeña empresa, ¿puedes darme algunas ideas?".
Algunos de estos escenarios son más personales, mientras que otros están empezando a desdibujar las líneas entre lo personal y lo profesional. Y mi opinión es: todos estos tipos de consultas deberían ser algo que una super app pueda manejar.
Greg Brockman:
Pero si miras hacia atrás a la evolución de ChatGPT, ha estado evolucionando por sí mismo.
Solía ser sin estado, ¿verdad? Para todos, era la misma IA, empezando de cero cada vez, casi como hablar con un extraño. Pero si puede recordar tus interacciones pasadas, se vuelve mucho más poderosa. Si puede aprovechar más contexto, también se vuelve mucho más poderosa.
Por ejemplo, conectarla a tu correo electrónico, tu calendario, entender realmente tus preferencias, tener un conjunto más profundo de información de fondo sobre tus experiencias pasadas y luego usar esto para ayudarte a lograr tus objetivos. Por ejemplo, ChatGPT ya tiene una función llamada Pulse, que entrega contenido diariamente basado en su comprensión de ti.
Así que, a nivel de uso individual, la super app abarcará todo esto y lo hará de manera más profunda y rica.
Alex:
¿Cuándo planeas lanzarla?
Greg Brockman:
Una forma más precisa de pensarlo es que, durante los próximos meses, avanzaremos progresivamente en esta dirección. La visión completa de la que estamos hablando se entregará paso a paso, no toda a la vez; se desplegará en etapas.
Por ejemplo, la aplicación Codex de hoy en día contiene en realidad dos capas: una es un arnés de agente genérico que puede usar herramientas; la otra es un agente bueno para escribir código.
Y este arnés genérico puede usarse de hecho para muchos otros escenarios. Lo conectas a una hoja de cálculo, lo conectas a un documento de Word y puede ayudarte con el trabajo de conocimiento.
Así que nuestro primer paso es hacer que la aplicación Codex sea más fácil de usar para el trabajo de conocimiento general. Porque ya hemos visto dentro de OpenAI que la gente ha comenzado espontáneamente a usarla de esta manera.
Este será el primer paso, con muchos más por venir.
Alex:
Cuando hablaba con uno de tus colegas sobre Codex ayer, mencionó que alguien está usando Codex para edición de vídeo: hizo que Codex le ayudara a procesar vídeos, Codex incluso creó un plugin para Adobe Premiere para segmentar el vídeo y luego comenzar a editar. ¿Es esta la dirección a la que aspiras?
Greg Brockman:
Me encanta especialmente escuchar sobre estos casos de uso. Esta es exactamente la forma en que esperamos que se utilice este sistema. Lo que es realmente interesante es que la aplicación Codex fue diseñada originalmente para ingenieros de software, por lo que su usabilidad actual en realidad no es muy alta para los no programadores. Porque durante el proceso de configuración, pueden surgir muchos problemas pequeños.
Los desarrolladores pueden entender inmediatamente lo que eso significa y cómo solucionarlo; ya estamos acostumbrados. Pero si no eres desarrollador, cuando ves esto, podrías pensar: "¿Qué es esto? Nunca había visto esto antes".
Sin embargo, aun así, hemos visto a muchas personas que nunca antes habían escrito código empezar a usarlo para construir sitios web o hacer cosas como lo que acabas de mencionar: automatizar interacciones entre diferentes softwares, obteniendo un apalancamiento significativo de ello. Por ejemplo, alguien en nuestro equipo de comunicaciones lo ha integrado con Slack y correo electrónico para que procese una gran cantidad de comentarios, y ha producido muy buenos resúmenes y análisis.
Así que la situación actual es: aquellos que están muy motivados ya están dispuestos a superar estas barreras y luego obtener grandes recompensas de ello.
En cierto sentido, la parte más difícil ya está hecha: hemos creado una IA verdaderamente inteligente y capaz que realmente puede realizar tareas.
Lo que tenemos que hacer a continuación es la parte relativamente "fácil": hacerla verdaderamente útil para el público en general, rompiendo gradualmente estas barreras de entrada.
Alex:
Mirando el panorama competitivo, Anthropic ahora también tiene la aplicación Claude, que incluye tanto un chatbot como Claude Code. Hasta cierto punto, ya tienen el prototipo de su propia "super app".
¿Cómo ves por qué Anthropic tomó esta decisión antes? ¿Y qué probabilidades crees que tiene OpenAI de ponerse al día?
Greg Brockman:
Si rebobinas el reloj de 12 a 18 meses, en realidad siempre nos centramos en la "programación" como un área clave y sobresalimos constantemente en varias competiciones de programación y otras pruebas de "habilidad pura". Sin embargo, una cosa en la que no invertimos lo suficiente en ese momento fue la última milla de la usabilidad.
Es decir, no prestamos suficiente atención a este problema: la IA ya es muy inteligente, capaz de resolver varios problemas de programación difíciles, pero nunca ha visto bases de código en el mundo real, y las bases de código del mundo real a menudo son desordenadas, lejos de los entornos "limpios" con los que está familiarizada.
En ese momento, estábamos efectivamente detrás. Pero a partir de mediados del año pasado, comenzamos a tomarnos esto muy en serio. Formamos un equipo específicamente para investigar todas estas brechas, el desorden del mundo real y la complejidad que no habíamos encontrado realmente antes.
Por ejemplo, ¿cómo construir datos de entrenamiento? ¿Cómo configurar un entorno de entrenamiento? ¿Qué se siente realmente para la IA "hacer ingeniería de software": ser interrumpida, encontrar problemas extraños, varias situaciones no ideales, etcétera.
Creo que a estas alturas, nos hemos puesto al día. Cuando los usuarios realmente nos comparan con los competidores lado a lado, muchas personas tienden a inclinarse más por elegirnos.
Por supuesto, también sabemos que tenemos una brecha en la experiencia de front-end, y abordaremos esta parte. Pero en general, este ha sido nuestro enfoque durante este tiempo: no solo construir un modelo y luego ponerle una capa de producto; sino más bien, pensarlo como un producto completo desde el principio. Mientras investigamos, también pensamos: ¿cómo se usará finalmente? Este es un cambio que ha estado ocurriendo internamente en OpenAI durante este tiempo.
Así que, en mi opinión, tendremos una ola muy fuerte de actualizaciones de modelos a continuación. Solo mirando la hoja de ruta de este año, estoy muy emocionado, realmente hay muchas cosas que se pueden lograr.
Al mismo tiempo, también estamos muy enfocados en completar la última milla de la usabilidad.
Alex:
Desde 2022, OpenAI ha sido como el líder indiscutible en este campo. Obviamente, la competencia ahora ya no es solo sobre las puntuaciones de las pruebas. Acabas de usar la frase "nos pusimos al día" tú mismo.
¿Ha cambiado también la atmósfera interna de la empresa? En otras palabras, ¿no es la misma sensación de estar muy por delante en un producto como ChatGPT que en el pasado, sino entrar realmente en una competencia real?
Algunos informes externos muestran realmente este cambio, como reuniones internas que enfatizan que OpenAI ya no tiene "tareas secundarias" y que todos deberían centrarse en esta dirección central. Entonces, ¿qué tipo de cambios han ocurrido en el entorno y la atmósfera interna ahora?
Greg Brockman:
Diría que, para mí personalmente, el momento más inquietante en OpenAI fue en realidad después de que lanzamos ChatGPT.
Recuerdo estar en la fiesta navideña de la empresa, y había esta sensación de "lo hemos logrado" en el aire. Nunca había sentido eso antes. Mi reacción en ese momento fue: No, no somos las personas que lo han logrado, somos los desvalidos.
Y siempre lo hemos sido. Los competidores en este espacio son en su mayoría grandes empresas consolidadas con más financiación, más personas, más datos y casi todos los recursos más abundantes.
Entonces, ¿por qué OpenAI puede competir? Hasta cierto punto, la respuesta es que nunca nos sentimos cómodos. Siempre nos vimos a nosotros mismos como el retador.
De hecho, para mí, ver que el mercado realmente comienza a adoptar esta dinámica competitiva, ver que otros competidores emergen y lo hacen bien, ha sido algo muy saludable.
Porque, en mi opinión, nunca puedes obsesionarte con dónde están tus competidores. Si solo miras dónde están ahora, para cuando llegues allí, ellos ya se habrán movido.
Y siento que, en los últimos tiempos, en realidad ha sido al revés: muchas personas se han centrado en dónde estamos nosotros, y hemos podido seguir avanzando. Esto nos ha dado un sentido de alineación y unidad internamente.
Mencioné antes que solíamos tratar casi la "investigación" y el "despliegue" como dos cosas separadas; y ahora, realmente queremos integrarlas. Para mí, esto es algo maravilloso.
Así que diría que la etapa en la que estamos ahora no es una fase en la que sienta que hemos estado "ganando con seguridad" o repentinamente en crisis. Sabes, las percepciones externas sobre ti tienden a no ser tan buenas como dicen, ni tan malas.
Siento que, en general, hemos sido bastante estables. Y en términos de desarrollo de modelos centrales, estoy muy seguro de nuestra hoja de ruta y del trabajo de investigación que hemos realizado. En cuanto al lado del producto, siento que tenemos una energía realmente buena ahora, todos se están uniendo para entregar realmente estas cosas al mundo.
Alex:
Has mencionado varias veces antes que habrá algunos modelos nuevos muy fuertes. Entonces, ¿qué son exactamente?
The Information informó que has completado el pre-entrenamiento en "Spud"; y Sam Altman también dijo al personal de OpenAI internamente que deberían ver un modelo muy fuerte en unas pocas semanas. Eso fue hace unas semanas. El equipo internamente cree que podría incluso impulsar la aceleración económica y las cosas están progresando más rápido de lo que mucha gente esperaba.
Entonces, ¿qué es "Spud" exactamente?
Greg Brockman:
Es un gran modelo. Pero creo que el enfoque no está realmente en un solo modelo.
Nuestro proceso de investigación es aproximadamente así: primero es el pre-entrenamiento, que es producir un nuevo modelo base, y luego todas las mejoras adicionales se construirán sobre este modelo base. Y este paso a menudo requiere que muchos equipos internos dentro de la empresa pongan un esfuerzo enorme. De hecho, durante los últimos 18 meses, la mayor parte de mi tiempo se ha dedicado aquí: principalmente en torno a la infraestructura de GPU, apoyando a los equipos responsables del marco de entrenamiento y ejecutando realmente estas tareas de entrenamiento a gran escala.
Luego viene la etapa de aprendizaje por refuerzo. Aquí es donde esta IA, que ya ha aprendido mucho conocimiento del mundo, comienza a aplicar realmente ese conocimiento.
Lo siguiente es el proceso de ajuste fino. En esta etapa, realmente le dirás: bueno, ahora que sabes cómo resolver problemas, adelante y practica en varios escenarios diferentes.
Finalmente, hay una etapa de "última milla" relacionada con el comportamiento y la usabilidad.
Así que vería a Spud como una nueva base, un nuevo modelo de pre-entrenamiento. Y sobre él, puedes decir que nuestra investigación de los últimos dos años está comenzando a mostrar resultados reales. Va a ser muy emocionante.
Creo que lo que el mundo exterior sentirá finalmente es una mejora general en la capacidad. Pero para mí, esto nunca ha sido solo un problema de lanzamiento único. Porque tan pronto como sale esta versión, en realidad es solo una versión temprana de muchos más avances por venir. Seguiremos haciendo más en cada etapa de este proceso de mejora.
Así que creo que somos más como tener un motor de progreso que siempre se acelera ahora, y Spud es solo un hito en este camino.
Alex:
Entonces, ¿qué crees que puede hacer que los modelos de hoy no pueden?
Greg Brockman:
Creo que será capaz de resolver problemas más difíciles y volverse más matizado. Entenderá mejor las instrucciones y el contexto.
A veces la gente habla de una sensación llamada "olor a modelo grande", lo que significa que, cuando el modelo es realmente más inteligente y capaz, puedes sentirlo claramente. Seguirá tu intención más de cerca y se adaptará mejor a tus necesidades.
Cuando haces una pregunta y la IA realmente no entiende lo que quieres decir, esa sensación sigue siendo muy decepcionante. No puedes evitar pensar: esto es algo que claramente deberías poder resolver por tu cuenta.
Así que diría que, en cierto sentido, esto será el resultado de la acumulación de muchos "cambios cuantitativos" que conducen a un "cambio cualitativo". Por un lado, habrá mejoras significativas en varias métricas; por otro lado, surgirán algunos escenarios completamente nuevos: anteriormente, podrías haber sido demasiado perezoso para usar la IA porque no era lo suficientemente confiable, pero ahora la usarías sin dudarlo.
Creo que este será un cambio integral. Estoy especialmente ansioso por ver cómo seguirá elevando el límite de la capacidad. Ya hemos visto su rendimiento en escenarios como la investigación física, y creo que a continuación, será capaz de abordar problemas más abiertos y abarcar marcos de tiempo más largos.
Al mismo tiempo, también estoy ansioso por ver cómo elevará el piso de la capacidad, lo que significa que no importa lo que quieras hacer, será mucho más útil que hoy.
Alex:
Pero para el usuario promedio, sentir este tipo de cambio a veces no es fácil. Por ejemplo, antes del lanzamiento de GPT-5, en realidad hubo mucho bombo y anticipación; sin embargo, cuando realmente salió, la reacción pública inicial fue algo decepcionante hasta cierto punto. Más tarde, todos descubrieron lentamente que en realidad era muy poderoso en ciertas tareas específicas.
Entonces, para la próxima generación de modelos, ¿crees que se sentirá principalmente en ciertos escenarios profesionales, o será un tipo de mejora que todos sientan de manera más intuitiva y universal?
Greg Brockman:
Creo que la historia podría ser similar. Después de que se lance el modelo, algunas personas sentirán inmediatamente que es una transformación completa en comparación con lo que han visto antes. Pero también habrá algunos casos de uso donde el cuello de botella no está en la "inteligencia". Así que si solo haces que el modelo sea más inteligente, en estas áreas, es posible que los usuarios no sientan la diferencia de inmediato.
Sin embargo, con el tiempo, creo que todos sentirán eventualmente el cambio. Porque lo que realmente cambia es: hasta qué punto comienzas a depender de este sistema.
Si piensas en cómo interactuamos con la IA ahora, todos tienen en realidad un modelo mental de "lo que puede hacer". Y este modelo mental no cambia rápidamente. Por lo general, evoluciona a medida que ganas experiencia, y luego ocasionalmente hace algo mágico por ti, y de repente te das cuenta: guau, realmente puede hacer esto, algo en lo que nunca pensé antes.
Por ejemplo, en escenarios como acceder a información médica, ya hemos visto casos similares. Tengo un amigo que usó ChatGPT para explorar diferentes opciones de tratamiento para su cáncer. El médico le había dicho previamente que estaba en etapa avanzada y que no había nada más que hacer. Pero usó ChatGPT para investigar muchas ideas diferentes y realmente encontró un tratamiento gracias a ello.
En un escenario como este, la premisa es en realidad: tienes que tener cierto nivel de confianza en la capacidad de la IA para ayudar en este contexto antes de estar dispuesto a invertir tanto esfuerzo en extraer valor del sistema.
Así que creo que lo que veremos a continuación es: en cualquier escenario de aplicación similar, lo que la IA puede ayudarte a hacer será más obvio para todos.
Por lo tanto, esto no es solo sobre la tecnología en sí misma volviéndose más fuerte, sino también sobre nuestra comprensión de la tecnología cambiando y poniéndose al día con ella.
Alex:
Entonces, cada vez confiarás más en ella. Dentro de OpenAI, también estás desarrollando un investigador de IA automatizado, que se dice que se lanzará este otoño. Entonces, ¿qué es exactamente eso?
La IA entra en su fase de "despegue"
Greg Brockman:
Creo que, desde una perspectiva de tendencia general, estamos ahora en la etapa temprana de este despegue tecnológico.
Alex:
¿Qué significa "despegue"?
Greg Brockman:
Despegue se refiere a que la IA se vuelve continuamente más fuerte a lo largo de una curva exponencial. Y parte de la razón de esto es: ya podemos usar la IA para ayudarnos a mejorar la IA misma, por lo que todo el proceso de investigación también se está acelerando.
Pero creo que ese "despegue" no es solo una cuestión tecnológica; también significa la liberación del impacto en el mundo real. El desarrollo de muchas tecnologías sigue una curva en forma de S; y si miras múltiples curvas en S durante un marco de tiempo más largo, eventualmente convergerán en una forma de crecimiento casi exponencial.
Creo que estamos actualmente en tal etapa. Es decir, la tecnología en sí misma está avanzando a un ritmo cada vez más rápido, y este motor de progreso está ganando impulso continuamente.
Al mismo tiempo, en el mundo exterior, se están formando muchos vientos de cola: los desarrolladores de chips están recibiendo más recursos; muchas personas están trabajando en varias aplicaciones, tratando de incrustar la IA en diferentes escenarios y buscando los puntos de convergencia entre ella y varias necesidades específicas.
Toda esta energía se está acumulando constantemente, impulsando colectivamente a la IA hacia una "fase de despegue", transformándola de una existencia marginal al motor principal que impulsa el crecimiento económico.
Y esto no solo está sucediendo dentro de las paredes de nuestra organización. Concierne a todo el mundo, a todo el sistema económico, cómo avanzar colectivamente en esta tecnología y cómo su practicidad continúa progresando.
Alex:
Entonces, ¿qué hará específicamente este "investigador"?
Greg Brockman:
El llamado "Investigador" se refiere esencialmente a: a medida que aumenta la proporción de tareas que la IA puede asumir, deberíamos permitirle operar de manera más autónoma.
Por supuesto, hay muchos aspectos detrás de esto que necesitan una consideración cuidadosa. No significa: lo lanzamos, dejamos que funcione por su cuenta durante un tiempo y luego volvemos más tarde para ver si ha producido buenos resultados.
Creo que seguiremos estando muy profundamente involucrados en su gestión. Al igual que ahora, si tienes un investigador junior y lo dejas solo durante demasiado tiempo, es probable que tome un camino que no ofrezca mucho valor. Pero si tienes un investigador senior, o alguien con un sentido real de dirección guiándolo, es posible que ni siquiera necesiten dominar personalmente todas las habilidades operativas específicas, pero aún pueden proporcionar comentarios continuos sobre lo que la persona está produciendo, revisarlo y proporcionar orientación sobre la dirección: qué es exactamente lo que espero que logres.
Así que el sistema tal como lo entiendo es un conjunto de mecanismos que estamos construyendo que aumentará significativamente la velocidad de nuestra salida de modelos, impulsará nuevos avances en la investigación y hará que estos modelos sean más útiles y utilizables en el mundo real. Y todo esto sucederá a un ritmo cada vez más rápido.
Alex:
¿Qué hará específicamente? ¿Le dirás directamente "encuentra la AGI" y luego lo intentará por su cuenta?
Greg Brockman:
Hasta cierto punto, sí lo veo de esa manera, al menos en el primer sentido. Pero si se mira desde una perspectiva más práctica, lo entendería como: tomar todo el flujo de trabajo de uno de nuestros científicos de investigación de principio a fin e intentar ejecutarlo tanto como sea posible en un sistema basado en silicio.
Alex:
Otra forma de entender el "despegue" es: el progreso de la IA pasará de una mejora incremental a acumular impulso, evolucionando eventualmente hacia un proceso de propulsión casi imparable hacia una inteligencia más inteligente que la humana.
¿Te preocupa que, así como las cosas pueden desarrollarse en una dirección positiva, este progreso mismo pueda salirse de control, desviarse?
Greg Brockman:
Creo que, por supuesto, habrá, eso es sin duda. Creo que para disfrutar de los beneficios de esta tecnología, uno también debe considerar seriamente sus riesgos.
Si miras nuestro enfoque para el desarrollo técnico, encontrarás que hemos puesto mucho esfuerzo en la seguridad y la protección. Un buen ejemplo son los ataques de inyección de prompts. Si vas a crear una IA muy inteligente y poderosa que tiene acceso a muchas herramientas, ciertamente quieres asegurarte de que no sea desviada o manipulada por alguien que le dé una orden extraña.
Esto es algo en lo que hemos puesto mucho esfuerzo, y creo que hemos logrado muy buenos resultados. También tenemos un equipo muy fuerte responsable de este trabajo.
Curiosamente, algunos de estos problemas pueden analogarse a los humanos. Los humanos también son susceptibles a ataques de phishing, pueden ser engañados y pueden actuar sin el contexto completo.
Llevamos estas analogías a nuestro propio proceso de I+D. Siempre que lanzamos un modelo, desarrollamos un modelo, siempre pensamos: ¿cómo asegurar que realmente se alinee con los objetivos humanos, cómo asegurar que realmente ayude? Esto es algo que nos importa mucho.
Por supuesto, también hay algunos problemas más grandes que involucran a todo el mundo, toda la economía: ¿cómo cambiará todo? ¿Cómo pueden todos beneficiarse de esta tecnología? Estos no son solo problemas técnicos, ni OpenAI puede resolverlos solo. Pero sí, pienso a menudo no solo en avanzar la tecnología, sino también en asegurar que realmente pueda generar un impacto positivo acorde con su potencial.
Alex:
El problema es que esto parece una carrera. Lo que sucede dentro de las paredes de la sede de OpenAI también es replicado rápidamente por muchos jugadores de código abierto. Y estos jugadores a menudo son mucho más débiles en términos de límites de seguridad y medidas de protección.
Recuerdo que dijiste algo antes, la esencia era: los logros creativos requieren que muchas personas hagan muchas cosas bien, pero los resultados destructivos pueden requerir solo un actor malicioso. Este es al menos el lugar que más me preocupa. Porque esto es claramente una carrera, y el progreso es rápido. Muchos de tus pares han dicho que si todos aceptan detenerse, ellos también están dispuestos a detenerse. Pero ahora, parece que no hay señales de que esta carrera se ralentice en absoluto.
Entonces, ¿realmente vale la pena la recompensa por asumir tales riesgos?
Greg Brockman:
Creo que la recompensa vale la pena. Sin embargo, también siento que tal respuesta es todavía demasiado amplia y demasiado simplista.
Desde el inicio de OpenAI, nos hemos estado preguntando: ¿Qué futuro constituye un buen futuro? ¿Cómo puede esta tecnología elevar verdaderamente la situación de todos?
Puedes dividir esta pregunta en dos perspectivas. Una es una visión "centralizada": pensar que para hacer que esta tecnología sea segura, la mejor manera es que solo una entidad la desarrolle. Entonces no hay presión competitiva, y puedes hacer las cosas bien cuidadosamente, y cuando estés listo, decidir cómo entregárselo a todos. Esta idea es comprensible, pero hasta cierto punto, también es una solución muy difícil de aceptar.
Y otro camino, que es también el camino hacia el que nos inclinamos, es pensar desde la perspectiva de la "resiliencia". En otras palabras, verlo como un sistema abierto: muchos participantes están impulsando el desarrollo de esta tecnología, pero el enfoque no está solo en la tecnología en sí, sino más en construir la infraestructura social en torno a esta tecnología, permitiendo que sea abrazada de manera más segura.
Puedes pensar en el desarrollo de la electricidad. La electricidad también es producida por muchas personas e instituciones diferentes, y ella misma conlleva riesgos y peligros. Sin embargo, al mismo tiempo, hemos construido múltiples capas de infraestructura de seguridad a su alrededor: existen estándares de seguridad eléctrica, varias especificaciones de uso, enfoques regulatorios correspondientes a diferentes escalas. A una escala muy grande, incluso existen requisitos regulatorios especializados. Muchas personas pueden usar la electricidad de manera democratizada, junto con inspectores y todo un conjunto de sistemas de apoyo establecidos gradualmente en torno a las características de esta tecnología.
Y creo que la IA es igual. Lo que realmente vemos es que debe haber una amplia discusión social en torno a la IA. Si esta tecnología realmente va a llegar y cambiar la vida de todos, entonces las personas deben estar involucradas. No puede ser impulsada y decidida únicamente por un pequeño grupo centralizado en secreto.
Así que, para mí, este siempre ha sido un problema muy central: ¿De qué manera debería desarrollarse esta tecnología? Y en lo que realmente creemos es en un "ecosistema resiliente" formado gradualmente en torno al desarrollo tecnológico.
Alex:
Entonces, ¿estás diciendo que estamos actualmente en el proceso de "despegue", y todos estamos realmente ya en él? El CEO de NVIDIA, Jensen Huang, dijo recientemente que cree que se ha logrado la AGI. ¿Estás de acuerdo?
Greg Brockman:
Creo que la AGI tiene diferentes definiciones para diferentes personas. Y de hecho, muchas personas argumentarían que la tecnología que tenemos hoy ya se considera AGI.
Esto puede ser debatido. Pero creo que la parte verdaderamente interesante es que la tecnología que tenemos hoy todavía es muy "áspera", con un sentido claro de fragmentación.
En muchas tareas, como escribir código, ya es sobrehumana. La IA puede hacerlo, y ha reducido significativamente la fricción de crear cosas. Pero al mismo tiempo, todavía hay algunas cosas muy básicas que los humanos pueden hacer fácilmente pero con las que la IA todavía lucha.
Entonces, ¿dónde trazas la línea? Hasta cierto punto, es más como un "sentimiento", un juicio atmosférico, en lugar de una pregunta que pueda definirse estrictamente científicamente en este momento.
Así que para mí mismo, creo que estamos pasando claramente por ese momento. Si me mostraras estos sistemas hoy hace cinco años, diría: Sí, esto es de lo que estábamos hablando en aquel entonces. Es solo que la realidad ha crecido, luciendo muy diferente de lo que imaginamos originalmente. Es diferente de cualquier forma que alguna vez imaginamos.
Así que creo que necesitamos ajustar nuestros modelos mentales en consecuencia.
Alex:
Entonces, ¿quieres decir que aún no hemos llegado?
Greg Brockman:
Diría que probablemente ya estamos al 70% u 80%. Así que creo que estamos muy cerca.
Y creo que una cosa está muy clara: en los próximos años, definitivamente seremos testigos de la AGI. Su rendimiento puede ser todavía algo "irregular", no del todo suave y perfecto en todas partes. Pero el límite inferior de las tareas que puede realizar se elevará muy alto: casi para cualquier tarea intelectual que necesites realizar en una computadora, la IA puede hacerlo.
Así que ahora tengo que dar una respuesta algo incierta porque de hecho hay un poco de "principio de incertidumbre" en esto: puedes argumentarlo desde diferentes definiciones. Pero según mi definición personal, creo que casi hemos llegado. Da un paso más hacia adelante, y absolutamente hemos llegado.
Punto de inflexión clave: el traspaso del trabajo del 20% al 80%
Alex:
¿Qué pasó exactamente en diciembre de 2025? Porque eso pareció un punto de inflexión, la idea de "dejar que la máquina escriba código ininterrumpidamente durante varias horas seguidas" pasó repentinamente de una idea teórica a que todos comenzaran a decir: "Creo que puedo confiar en que siga funcionando por su cuenta durante un tiempo".
Entonces, ¿qué pasó realmente en ese momento?
Greg Brockman:
Después del lanzamiento del nuevo modelo, el porcentaje de tareas que la IA podía realizar saltó de alrededor del 20% de tu trabajo al 80% de una sola vez. Este fue un cambio extremadamente significativo. Porque ya no era solo "una pequeña herramienta bastante buena", sino que se convirtió en: tenías que reorganizar tu flujo de trabajo en torno a estas IA.
Para mí personalmente, también tuve un momento visceral muy típico. A lo largo de los años, tuve una señal de prueba: hacer que la IA construyera un sitio web para mí. Este sitio web era en realidad uno que había construido a mano cuando estaba aprendiendo a programar, tomándome varios meses.
Y para 2025, probablemente todavía tomaba cuatro horas y varias rondas de prompts de ida y vuelta para obtener algo decente. Pero para diciembre, pregunté una vez, y la IA lo hizo una vez, y lo hizo muy bien.
Alex:
Entonces, ¿cómo dieron estos modelos este salto?
Greg Brockman:
Una gran parte de la razón es que el modelo base en sí mismo se ha vuelto más fuerte. OpenAI ha estado mejorando continuamente sus técnicas de pre-entrenamiento. Y en ese punto, vimos un indicio de cómo se vería el resto del año. Pero al mismo tiempo, no fue solo un punto de avance único. Más exactamente, hemos estado avanzando en todas las dimensiones de la innovación.
Una cosa interesante sobre estos modelos es: en cierto sentido, podrías sentir que han tenido estos momentos de "discontinuidad" una y otra vez; pero desde otra perspectiva, todo ha sido una evolución continua. No saltó repentinamente del 0% al 80%, sino más bien del 20% al 80%. Así que, en cierto modo, también podrías decir que simplemente mejoró.
Y creo que este progreso continúa de hecho en cada actualización menor de versión posterior. Por ejemplo, de la 5.2 a la 5.3, tengo un ingeniero que colabora estrechamente conmigo que inicialmente no podía hacer que el modelo hiciera el trabajo de sistemas de bajo nivel y hardcore del que era responsable; pero con la nueva versión, el modelo pudo hacerse cargo de sus documentos de diseño, implementarlos realmente, agregar monitoreo de métricas y observabilidad, ejecutar un generador de perfiles para el análisis de rendimiento, continuar optimizando y, finalmente, lograr el resultado que originalmente esperaba entregar con sus propias manos.
Así que diría que es más como un proceso de "progreso incremental, y luego repentinamente todo ha cambiado". Pero todo esto ha sido presagiado por las capacidades actualmente en juego. En un año a más tardar, muchas cosas, algunas incluso mucho más rápidas, se volverán extremadamente confiables.
Alex:
¿No te sorprende esto también? Porque recuerdo que no hace mucho mencionaste en una entrevista que herramientas como Codex, una herramienta de programación automática, eran originalmente solo para desarrolladores de software. Pero al principio de la conversación de hoy, dijiste que en realidad todos pueden usar este tipo de herramientas.
¿Qué te hizo cambiar de opinión?
Greg Brockman:
En realidad, siempre enmarqué a Codex en el contexto de "escribir código". Después de todo, su nombre tiene código, así que es natural verlo como una herramienta para programadores. Y dentro de OpenAI, muchos de nosotros somos ingenieros de software, construyendo herramientas para nosotros mismos, así que era muy natural pensar de esta manera.
Pero a medida que esta tecnología progresaba, comenzamos a darnos cuenta de algo: la tecnología subyacente que hemos construido en realidad no es sobre "código" en absoluto, es fundamentalmente sobre "resolver problemas".
En su núcleo, se trata de gestionar el contexto, construir un marco de ejecución y pensar en cómo la IA debería conectarse al trabajo real, cómo hacer las cosas realmente. Y una vez que esto se establece, incluso en un contexto de programación, de repente significa que cualquiera puede tener esta capacidad. Porque lo que realmente tienes es un sistema que puede hacer el trabajo por ti. Siempre que tengas una visión, un objetivo que lograr y puedas describir tu intención claramente, la IA puede ir y ejecutar, puede hacer las cosas.
Pero esto también te hará empezar a preguntar, ¿por qué solo me estoy centrando en la división "no programación" o "programación"? De hecho, hay mucho trabajo que es esencialmente solo algún tipo de habilidad mecánica. Como hojas de cálculo de Excel, como hacer presentaciones. Si la IA ya tiene suficiente contexto y suficiente inteligencia bruta, en realidad puede hacer estas cosas muy bien ahora.
Entonces, si solo la hacemos más accesible, más fácil de usar, pasará de "Codex es para programadores" a repentinamente "Codex es para todos".
Alex:
Y después de que vimos este progreso claramente visible, Silicon Valley vio rápidamente surgir otro fenómeno casi silencioso, que es Open Claw, ¿verdad? O más ampliamente, toda la comunidad tecnológica está comenzando a confiar en la IA de la manera que acabas de mencionar, como entregar el control del escritorio a un robot de IA, o configurar un Mac mini, dándole permisos para correo electrónico, calendario, archivos y luego, hasta cierto punto, dejándolo "hacerse cargo de la vida".
Más tarde, OpenAI trajo al fundador de Open Claw a la empresa. Entonces, ¿podrías hablar un poco más sobre este tipo de IA que "te ayuda a gestionar tu vida"? Al traer al equipo de Open Claw, ¿la visión subyacente es algo así?
Greg Brockman:
Diría que el aspecto más central de esta tecnología es: descubrir cómo puede ser útil, cómo la gente realmente quiere usarla, cuál es la visión del agente inteligente, cómo entrará en la vida de las personas; estas son todas preguntas muy difíciles.
Lo que he visto repetidamente en esta evolución de la tecnología es que aquellos que están realmente dispuestos a participar profundamente, llenos de curiosidad y tienen una gran imaginación, esto en sí mismo es una capacidad muy real, y se convertirá en una capacidad cada vez más valiosa en la nueva economía.
El fundador de Open Claw, Peter, en mi opinión, es una persona así; tiene una gran imaginación y un fuerte impulso creativo. Así que, en cierto modo, esto está relacionado con una tecnología específica; pero de otra manera, no es solo un problema técnico en absoluto. Realmente se relaciona con: ¿cómo incrustamos estas capacidades en la vida de las personas, encontramos dónde pertenecen realmente?
Así que, como tecnólogo, esto es ciertamente emocionante; pero como alguien que realmente se preocupa por entregar valor práctico a los usuarios, ahora estamos invirtiendo mucho en esto, invirtiendo mucho.
Alex:
Recientemente tuviste un comentario interesante sobre esto. Dijiste que, cuando comienzas a tener estos agentes de IA autónomos trabajando para ti, te convertirás en el "CEO de una flota de miles de agentes inteligentes" que están trabajando para ti para lograr tus objetivos, visión y tareas, y ya no estás profundamente involucrado en los detalles de cómo se resuelven varios problemas.
Pero también mencionaste que, en cierto sentido, esta nueva forma de trabajar puede hacer que la gente sienta que está perdiendo el "pulso" del problema en sí.
Greg Brockman:
¿Es esto realmente algo bueno? Creo que es un arma de doble filo.
Así que creo que lo que tenemos que hacer es, por un lado, reconocer el verdadero poder que estas herramientas pueden traer y, por otro lado, tratar de mitigar tanto como sea posible las debilidades que traen. Por ejemplo, dar a las personas un mayor apalancamiento, dar a las personas una mayor agencia: si tienes una visión, algo que quieres lograr, entonces puedes movilizar a toda una flota de agentes para que lo hagan por ti, lo cual es por supuesto muy poderoso.
Pero si piensas en cómo opera el mundo, al final tiene que haber alguien responsable. Supongamos que estás construyendo un sitio web y tu agente estropea las cosas, afectando finalmente al usuario, estrictamente hablando, no es culpa del agente, es tu culpa. Así que tienes que preocuparte por ello.
Creo que cualquiera que realmente quiera usar estas herramientas debe reconocer: la agencia humana, la responsabilidad humana, son partes centrales de todo el sistema. Cómo los humanos usan la IA es fundamentalmente importante.
Así que creo que el punto más importante es: como usuarios de estos agentes (también somos así dentro de OpenAI), no puedes abdicar de la responsabilidad. No puedes simplemente decir: "La IA se encargará de todo por su cuenta".
Alex:
Por supuesto. Pero lo que acabas de decir sobre "sentir que estás perdiendo el pulso del problema" parece ser diferente de la "responsabilidad".
Greg Brockman:
Para mí, estos dos están en realidad conectados. Porque la clave es: si eres un CEO, pero estás demasiado alejado de los detalles (como si estuvieras liderando un equipo, dirigiendo una empresa, pero has perdido el contacto con la primera línea), eso generalmente no conduce a buenos resultados. Así que lo que quería expresar hace un momento no es que "los humanos finalmente puedan no saber nada" sea algo que valga la pena perseguir.
Por supuesto, algunos detalles pueden de hecho ser entregados con confianza. Como cuando contratas a un contratista general para construir tu casa, hay muchos detalles que probablemente no necesites supervisar personalmente porque confías en que la otra parte lo manejará bien. Pero finalmente, si algunos detalles clave salen mal, todavía deberías preocuparte y todavía deberías saberlo.
Así que aquí hay una diferencia sutil muy importante: no puedes simplemente decir ciegamente: "Estoy dispuesto a perder esa sensación de control sobre el problema". En cambio, deberíamos decir activamente: todavía necesito mantener esa conciencia para entender realmente las fortalezas y debilidades del sistema.
Y a medida que comienzas a extraerse de algunas de las transacciones más mecánicas y de bajo nivel, la razón por la que puedes hacer eso debería ser porque ya has establecido confianza en este sistema, confirmando que realmente hace las cosas bien.
Alex:
Con respecto a los modelos, tengo una pregunta final. Has mencionado un camino de evolución del modelo: desde el pre-entrenamiento, al ajuste fino, al aprendizaje por refuerzo, haciéndolo mejor para resolver problemas paso a paso y siendo capaz de realizar tareas en Internet.
Y ahora hemos llegado a una etapa donde el modelo ha aprendido a usar herramientas a través de este proceso. Si entiendo correctamente, ¿cuál sería el siguiente paso en este camino de evolución?
Greg Brockman:
Creo que el mundo en el que estamos ahora es un mundo donde las capacidades de las máquinas se están profundizando y expandiendo continuamente. Parte de ello es ciertamente sobre el uso de herramientas, pero al mismo tiempo, también necesitamos hacer que las "herramientas" mismas sean lo suficientemente buenas. Por ejemplo, si la IA ya puede hacer "operaciones informáticas" y usar sistemas de escritorio como los humanos, entonces, en principio, puede hacer cualquier cosa que tú puedas hacer.
Pero al mismo tiempo, también necesitamos proporcionar muchas cosas a nivel de infraestructura para la máquina. Por ejemplo, en un entorno empresarial, ¿cómo haces la autenticación de identidad y la gestión de autorización? ¿Cómo haces los registros de auditoría y la observabilidad? Para ponerse al día con el desarrollo de las capacidades subyacentes del modelo, se necesita construir muchas tecnologías de apoyo.
Y desde una dirección general, creo que incluirá cosas como una "interfaz de voz muy natural". Es decir, puedes tener una conversación natural con una computadora como lo haces ahora, donde realmente puede entenderte, hacer lo que necesitas que haga y proporcionar sugerencias valiosas.
Por ejemplo, te recordará proactivamente: algo en lo que has estado progresando ahora está atascado, y el problema está aquí. O cuando te despiertas por la mañana, te dirá: aquí está tu resumen diario, cuánto trabajo progresaron tus agentes anoche.
Quizás incluso está dirigiendo un negocio para ti; creo que esta sería una gran aplicación de esta tecnología. La democratización del emprendimiento definitivamente sucederá. Te dirá: estas áreas son problemáticas; un cliente está muy insatisfecho ahora y quiere hablar con una persona real, será mejor que lo manejes tú mismo. Estas cosas sucederán.
Entonces, creo que la siguiente etapa también incluye: el límite superior de desafíos para los humanos continuará siendo elevado por esta tecnología. De hecho, ya estamos a la vanguardia de esta tendencia. Lo que más me emociona es casi análogo al Movimiento 37 de AlphaGo; ese movimiento es algo que los humanos nunca habrían hecho, es creativo y ha cambiado la comprensión de muchas personas sobre el juego.
Este tipo de cosas sucederá en todos los campos. Sucederá en ciencia, matemáticas, física, química; sucederá en ciencia de materiales, biología, atención médica, descubrimiento de fármacos; e incluso puede suceder en literatura, poesía y muchos otros campos. Desbloqueará nuevos espacios de creatividad y comprensión humana de maneras que aún no podemos imaginar hoy.
Alex:
Pero si el modelo ya es tan poderoso como dices, ¿por qué no ha sucedido esto realmente hasta ahora?
Greg Brockman:
Creo que hay un "retraso de capacidad" en juego aquí, lo que significa que todavía hay una brecha significativa entre las capacidades reales del modelo y cómo la gente lo está usando actualmente. Hasta cierto punto, nuestra comprensión de lo que hay "dentro" del modelo todavía está evolucionando.
Así que creo que incluso si el progreso tecnológico se detuviera a partir de este punto, el mundo todavía experimentaría un cambio masivo: una economía impulsada por la computación, impulsada por la IA, todavía llegaría.
Pero al mismo tiempo, hay otra capa en esto: en lo que somos mejores ahora mismo es en entrenar modelos en tareas que son "medibles". Así que inicialmente, comenzamos con problemas matemáticos, tareas de programación porque estas tareas tienen validadores muy claros: o la respuesta es correcta o no, lo que facilita juzgar. Y con el tiempo, la razón por la que hemos podido empujar gradualmente a los modelos hacia preguntas más abiertas es expandiendo el alcance de "lo que se puede validar, evaluar".
La IA misma también puede ayudar con esto. Si la IA es lo suficientemente inteligente, entiende la tarea y se le da un criterio de evaluación, puede aprender gradualmente. Sin embargo, tareas como la escritura creativa, como "qué tan bueno es este poema", son difíciles de calificar.
Por lo tanto, en este tipo de escenarios en el pasado, de hecho ha sido un desafío hacer que la IA aprenda verdaderamente a través de prueba y retroalimentación continuas. Sin embargo, todo esto está cambiando, y ya tenemos una visión bastante clara del camino por delante.
Alex:
Eso es bastante interesante. Peter Thiel dijo una vez algo parecido a: si eres bueno en matemáticas, el impacto que podrías experimentar frente a estos modelos podría ser incluso mayor que el de una persona "buena con las palabras". Y tú también fuiste miembro del Club de Matemáticas en el pasado. ¿No te preocupa esto?
Greg Brockman:
Creo que la gente tiende a ver más lo que ha perdido que lo que ha ganado. Es porque tenemos una experiencia profunda de "cómo solía hacer esto". Por ejemplo, solía participar en competiciones de matemáticas, y ahora la IA también puede hacer competiciones de matemáticas. Pero la cosa es que esto nunca fue realmente sobre "competiciones de matemáticas" en sí, ¿verdad? Eso no es lo central que impulsa el progreso humano.
Si miras cómo trabajamos ahora (sentados frente a una caja, escribiendo en otra), no vivíamos así hace cien años. Este no es un estado natural, ni es realmente cómo deberíamos existir en este mundo digital en el que hemos sido arrastrados.
Esa no es la esencia de "ser humano". Lo que realmente importa es estar presente, vivir el momento y conectar con los demás.
Y creo que lo que estamos a punto de ver es: la IA liberará una cantidad significativa de tiempo, permitiendo a los humanos más oportunidades para fortalecer las conexiones entre sí, para construir más vínculos entre las personas.
Esto me emociona mucho.
Alex:
Correcto. Entonces, a medida que avanzas más hacia estas aplicaciones similares a agentes, hay una discusión emergente sobre si las grandes tareas de entrenamiento seguirán siendo necesarias en el futuro.
Especialmente cuando el modelo ya es lo suficientemente bueno, parece que puedes simplemente desplegarlo en el mundo real y obtener una mejora significativa a través de muchas etapas que no dependen del pre-entrenamiento. Y aquellos que realmente requieren un soporte masivo de centros de datos son principalmente para el pre-entrenamiento, de hecho.
Siempre has estado a cargo de escalar, impulsando este esfuerzo. ¿Cómo ves este argumento?
Greg Brockman:
Creo que este argumento pasa por alto un punto muy importante en el avance tecnológico. De hecho, cada paso en la tubería de producción de modelos amplifica los efectos de los demás. Así que querrías que cada paso se volviera más fuerte.
Vemos que: una vez que el pre-entrenamiento se vuelve más fuerte, cada paso posterior se vuelve mucho más fácil. Esto en realidad tiene sentido. Porque el modelo es más capaz desde el principio, aprende más rápido; también avanza más rápido a medida que intenta diferentes enfoques, aprende de sus errores y progresa más rápido con menos errores debido a su base más fuerte.
Por lo tanto, el gran cambio real no es que estemos pasando de "entrenar un sistema racional cerrado y auto-derivado" a "simplemente dejar que cometa errores en el mundo real". En cambio, nos damos cuenta de que no solo necesitamos hacer que el modelo en sí sea más grande y más fuerte, sino también dejar que intente cosas, entienda cómo la gente lo usa en el mundo real y alimente esa retroalimentación de uso en el proceso de entrenamiento. Esto no disminuye el valor de continuar avanzando en esa investigación, ni disminuye su importancia.
También creo que hay otro cambio: en el pasado, nos centramos principalmente en mejorar las capacidades brutas durante la fase de pre-entrenamiento, pero no enfatizamos tanto la capacidad durante la etapa de razonamiento o inferencia. Y durante los últimos 24 meses, un cambio significativo ha sido que estamos comenzando a darnos cuenta de la necesidad de un equilibrio entre los dos.
En otras palabras, puedes tener un modelo con una capacidad muy fuerte, pero también necesita ser lo suficientemente eficiente durante la inferencia y el despliegue real. Porque si vas a hacer aprendizaje por refuerzo y realmente desplegarlo en el mundo real, todo esto requiere una eficiencia de inferencia muy fuerte.
Esto también significa que es posible que no necesariamente lleves la escala de entrenamiento a la teóricamente más grande posible, porque también tienes que considerar escenarios de uso a gran escala posteriores.
Lo que realmente quieres es: el punto óptimo del producto entre el nivel de inteligencia y el costo, en lugar de solo optimizar una dimensión.
Alex:
Si el futuro cambia principalmente hacia la inferencia, ¿ya no necesitarías tanto las GPU de Nvidia?
Greg Brockman:
Todavía las necesitamos absolutamente.
Alex:
¿Por qué?
Greg Brockman:
Hay muchas razones.
Una de ellas es: no importa cómo cambie la proporción entre entrenamiento e inferencia, el entrenamiento a gran escala es todavía algo que solo se puede hacer concentrando una potencia de cálculo masiva en un problema, y actualmente no hay una forma alternativa de hacer esto.
Así que creo que lo que es más probable que suceda en el futuro es: la proporción de potencia de cálculo en el lado del despliegue aumentará significativamente; pero al mismo tiempo, todavía habrá momentos en los que tengas que llevar a cabo una tarea de pre-entrenamiento particularmente grande, y en ese momento todavía necesitas concentrar una gran cantidad de potencia de cálculo.
Y también creo que el equipo de Nvidia es realmente sobresaliente, el trabajo que hacen es asombroso. Así que, sí, trabajamos muy de cerca con ellos.
Alex:
¿Llegará un día en que la gente empiece a decir: "Hemos pre-entrenado lo suficiente, el modelo ya es lo suficientemente inteligente"?
Greg Brockman:
Creo que esto es un poco como decir: cuando los humanos hayan resuelto todos los problemas frente a ellos, tal vez podamos decir eso. Pero creo que el límite de lo que queremos lograr es en realidad mucho más alto.
Durante los últimos 50 años, hasta cierto punto, nuestra ambición por muchos objetivos ha disminuido de hecho. Por ejemplo, algunos problemas parecen muy claros: ¿podemos asegurar que todos tengan cobertura de salud? Y no solo "tratar cuando hay un problema", sino lograr verdaderamente la atención médica preventiva, centrarse en el estilo de vida, ayudar a las personas temprano, detectar riesgos potenciales antes de que ocurra una enfermedad. Creo que podemos usar modelos más inteligentes para resolver verdaderamente este tipo de problemas.
Por supuesto, tal vez hay algún nivel donde este problema se ha abordado a fondo, y en ese punto podrías preguntar: ¿Todavía necesito un modelo dos veces más inteligente? Pero al mismo tiempo, ciertamente habrá otros problemas que exijan un mayor nivel de inteligencia.
La potencia de cálculo no es un costo, sino un motor de ingresos
Alex:
Hablemos de los números detrás de la construcción de estos centros de datos. A principios de este año, recaudaste 110 mil millones de dólares. ¿Cómo funcionaron las matemáticas allí? ¿Este dinero va directamente a los centros de datos? ¿Cómo piensas devolver este dinero a los inversores en el futuro? Habla de esta lógica en la computación.
Greg Brockman:
Creo que, fundamentalmente, esto es muy simple: nuestro mayor gasto ahora mismo es la potencia de cálculo. Pero no puedes simplemente mirar la potencia de cálculo como un centro de costos; es más como un centro de ingresos.
Puedes pensar en ello como contratar a un equipo de ventas. ¿A cuántos vendedores estás dispuesto a contratar? Mientras tu producto pueda venderse, mientras tengas un mecanismo para escalar las ventas de este producto, cuantos más vendedores contrates, mayores serán los ingresos.
Y el mundo en el que estamos ahora mismo es que seguimos encontrando que simplemente no podemos construir cómputo lo suficientemente rápido como para mantenernos al día con la demanda. Esto, puedo sentirlo muy concretamente ahora mismo. Tenemos que tomar decisiones muy dolorosas: qué características pueden salir al aire, qué características no pueden por el momento; dónde va primero la potencia de cálculo y dónde no.
Y creo que, a medida que toda la economía cambia hacia una economía impulsada por la IA, esta situación se sentirá mucho más ampliamente.
Qué problemas futuros reales serán: ¿qué problemas pueden obtener ese tipo de cómputo masivo? ¿Cómo escalas para que todos tengan su propia IA personal? ¿Cómo haces que todos usen sistemas como Codex?
Ahora mismo, simplemente no hay suficiente cómputo en el mundo para soportar estas cosas. Así que nos estamos preparando para este problema con antelación.
Alex:
Pero esto es finalmente una categoría completamente nueva, ¿verdad? Y estás usando un determinismo muy fuerte para apostar: una cantidad tan grande, casi nunca vista en el mundo. Cuando estás creando una nueva categoría, ¿cómo puedes estar tan seguro de que finalmente se mantendrá?
Greg Brockman:
Creo que hay varios componentes en esto.
Primero, de hecho hay un precedente histórico ahora. Desde el momento en que se lanzó ChatGPT, recuerdo haber tenido una conversación muy clara conmigo mismo y con el equipo. Alguien me preguntó: ¿Cuánto cómputo deberíamos comprar? Dije: Todo. Luego alguien preguntó de nuevo: No, en serio, ¿cuánto deberíamos comprar? Dije: No importa cómo construyamos, sé que no podemos mantenernos al día con la demanda.
Y cada año desde entonces ha probado ese punto. El desafío es que tales adquisiciones de potencia de hash normalmente deben bloquearse con 18 meses de antelación, a veces 24 meses, o incluso más. Así que tienes que tomar la decisión mucho antes de que las máquinas sean realmente entregadas. Esto significa que tienes que ser increíblemente previsor.
Y el mundo hacia el que nos movemos es: hasta la fecha, la mayor parte de nuestros ingresos todavía proviene de suscripciones de consumo, que también seguirán siendo muy importantes en el futuro. Por supuesto, también estamos creando otras fuentes de ingresos.
Pero la oportunidad emergente y más grande ahora es el trabajo de conocimiento.
Y esto, ya lo hemos visto muy concretamente: casi todas las empresas están empezando a darse cuenta de que esta tecnología es realmente útil, y si quieren seguir siendo competitivas, tienen que adoptarla. Puedes ver ese impulso muy natural, muchos ingenieros de software ya la están usando; y ahora estás empezando a ver una proliferación más generalizada, personas dentro de la empresa incorporándola en varios escenarios de trabajo de conocimiento. Y la disposición a pagar que ha surgido en esta industria, y el crecimiento de los ingresos que estás viendo, es muy claro.
Esto está sucediendo ahora mismo. Solo necesitas extrapolarlo. Y una cosa que podríamos ver más claramente que otros es: podemos ver mejor cómo progresarán estos modelos a continuación.
Juntando todas estas cosas, te das cuenta: esta economía en sí misma es una cosa extremadamente masiva, casi inimaginablemente. Y a partir de ahora, el motor principal de crecimiento para esta economía será la IA: qué tan bien puedes aprovechar la IA y cuánta potencia de hash tienes para impulsarla.
Alex:
Acabas de mencionar que las suscripciones de consumo son actualmente tu mayor fuente de ingresos. Entonces, ¿es tu juicio que en el futuro, esto se revertirá y las empresas se convertirán en la mayor fuente de ingresos?
Greg Brockman:
Creo que ahora está muy claro que este "lado empresarial" está creciendo rápidamente. Por supuesto, el término "lado empresarial" en sí mismo también está evolucionando. Porque lo que realmente señala es: personas usando IA en trabajo de conocimiento productivo.
Y en términos de precios, no creo que las categorías sean necesariamente tan claras como solían ser. Por ejemplo, el modelo de uso actual de Codex es: si tienes una suscripción de consumo a ChatGPT, ya tienes acceso a Codex.
Así que no creo que el futuro sea una división tan distinta entre B2B y B2C. El escenario más probable es: como usuario, tendrás un punto de entrada unificado, al igual que tu portátil, que es tu puerta de entrada al mundo digital.
Y los ingresos reales, fundamentalmente, vendrán de aquí.
Alex:
Dario dijo una vez algo, y creo que podría haber estado hablando de ti: Algunos jugadores han empujado el dial de riesgo demasiado alto, y está muy preocupado por ello. Creo que se refería a tu apuesta masiva en infraestructura. ¿Cuál es tu opinión sobre esta declaración?
Greg Brockman:
No estoy de acuerdo. Creo que siempre hemos sido muy cautelosos, y de hecho hemos visto lo que viene a continuación. Creo que incluso solo mirando este año, todos los que han participado realmente sentirán el 'cuello de botella de cómputo'.
Y creo que simplemente nos dimos cuenta de esto antes que otros, preparándonos antes para cómo se desarrollaría la tecnología.
Lo que he visto en cambio es que muchos otros participantes probablemente solo se dieron cuenta de esto a finales del año pasado y luego se apresuraron a buscar cómputo, solo para descubrir que casi no quedaba nada para comprar.
Así que creo que es fácil decir cosas así. Pero la realidad es que todos ahora se dan cuenta: esta tecnología es viable, está aquí, es real. La ingeniería de software es solo el primer ejemplo claro de ello.
Y lo que realmente nos limita es la computación disponible.
Alex:
También dijo que si su predicción se desvía aunque sea un poco, su empresa podría ir a la quiebra. ¿Te enfrentas al mismo riesgo?
Greg Brockman:
Creo que en realidad hay más una 'trampa' aquí. Si comienzas a pensar seriamente en el lado negativo (y creo que esa es una pregunta perfectamente justa), descubrirás que hasta cierto punto, esta apuesta no fue realmente en ninguna empresa.
Fue realmente en toda la industria. Es una apuesta sobre: ¿Crees que esta tecnología se puede hacer, y puede entregar el enorme valor que vemos hoy?
Sigo volviendo a esas pruebas más directas. Como la ingeniería de software: si no eres un ingeniero de software, si no has usado realmente Codex, es difícil entender la diferencia en la experiencia a través de la lectura. Esa diferencia es en realidad difícil de describir. Pero creo que la gente pronto lo sentirá realmente.
Hace seis meses, este tipo de experiencia palpable era principalmente interna para nosotros; más tarde, hubo pruebas externas claras también. Y en otros seis meses, creo que todos lo sentirán. Y para entonces, todos sentiremos otro tipo de dolor: hay grandes modelos ahí fuera, pero no puedes usarlos porque simplemente no hay suficiente cómputo en el mundo.
Alex:
Sí, pero cuando estábamos haciendo predicciones para 2026 en el programa, hubo una discusión a finales del año pasado. Ranjan Roy también estaba allí, y dijo que 2026 sería el año de 'todos usando un agente inteligente'. Mi reacción en ese momento fue: lo creeré cuando lo vea con mis propios ojos y cuando realmente comience a usar un agente inteligente yo mismo.
Greg Brockman:
Entonces, ahora, ¿no hemos llegado a ese momento? ¿Para qué lo usas ahora?
Alex:
Lo uso para construir algunas herramientas internas para ayudar a las personas con las que trabajo a sincronizarse mejor cuando los vídeos se publican, cómo se deben hacer las miniaturas y cosas así. También extraigo algunos datos de YouTube para que podamos analizar el rendimiento del vídeo en función de factores como las miniaturas. Hasta cierto punto, este es un conjunto de software que he personalizado yo mismo, y si se hiciera de una manera tradicional, probablemente no gastaría dinero para comprarlo en absoluto.
Creo que esto es lo que lo hace interesante ahora mismo: el software se producía originalmente a gran escala para el público en general, pero precisamente debido a esto, siempre hay muchos lugares en él que no están adaptados a ti. Y quizás el cambio provocado por la IA es que finalmente nos permite interactuar con el software de una manera más natural.
Greg Brockman:
Creo que esa es la clave. Y una cosa en la que he estado pensando constantemente es: la forma en que construimos computadoras hoy en realidad nos arrastra a un mundo digital.
Piensa en cuánto tiempo pasas desplazándote constantemente por contenido en tu teléfono. Luego piensa en cuánto tiempo pasas haciendo clic continuamente en varios botones, tratando de conectar este sistema con aquel sistema: ¿por qué tienes que hacer estas cosas tú mismo? Lo que la IA debería hacer realmente es acercar la máquina a ti, haciéndola más adaptada a ti y más comprensiva de lo que quieres lograr.
Esta idea siempre ha sido parte de nuestra cultura pop: puedes hablar directamente con la computadora y luego hace las cosas por ti. Y ahora, esto está empezando a convertirse en una realidad, realmente convirtiéndose en algo que puedes hacer. La magnitud de este cambio es verdaderamente asombrosa, y muchas veces tienes que probarlo tú mismo para entenderlo realmente. Así que realmente siento que estamos en un momento muy especial.
Alex:
Entonces me pregunto, ¿por qué la percepción pública de la IA es tan negativa? Por ejemplo, los datos de YouGov muestran que en los Estados Unidos, tres veces más personas creen que la IA tendrá un impacto negativo en la sociedad en comparación con aquellos que creen que tendrá un impacto positivo.
¿Cuál crees que es la razón detrás de esto? ¿Te preocupa la imagen pública de la IA?
Greg Brockman:
Creo que una cosa que realmente tenemos que hacer es: mostrar a la gente de este país por qué la IA es beneficiosa para ellos. Y no solo desde un punto de vista macroeconómico, no solo diciendo que impulsará el crecimiento del PIB y otras grandes palabras como esa, sino: cómo mejora realmente específicamente sus vidas.
De hecho, escucho historias muy específicas todos los días. Por ejemplo, hay una familia cuyo hijo ha tenido dolores de cabeza constantes y algunos otros problemas de salud, pero su resonancia magnética no ha sido aprobada. Más tarde, usaron ChatGPT para investigar los síntomas y se dieron cuenta de que en realidad podían usar esto para presentar un caso más sólido ante la compañía de seguros. Lo hicieron, y resultó que el niño sí tenía un tumor en el cerebro. Y fue porque obtuvieron la información correcta a través de ChatGPT que la vida del niño fue salvada.
Esa es solo una historia. Hay muchas, muchas historias similares. Las vidas de las personas han sido profundamente mejoradas por esta tecnología, y algunas incluso han sido salvadas por ella. La clave es que realmente se han comprometido con esta tecnología en la vida real.
Pero siento que este tipo de historias realmente no se han compartido ampliamente. Creo que esto está sucediendo en la vida de muchas personas, pero por alguna razón, realmente no se ha convertido en una narrativa convencional todavía.
También he notado que la cultura popular, especialmente la imaginación que ha persistido desde la década de 1990, es muy negativa sobre la IA, siempre enfatizando lo que podría salir mal. Pero una vez que la gente realmente comienza a usar la IA, descubren que tiene valor práctico, que es útil.
Así que me importa mucho esto: realmente no hemos tenido éxito en ayudar a la gente a entender por qué esta ola de tecnología mejorará sus vidas, por qué promoverá conexiones más estrechas entre los seres humanos.
Este es un enfoque muy importante para mí. Y si amplías un poco tu perspectiva para ver por qué la IA es tan importante, creo que se convertirá en una fuente significativa de poder económico y seguridad nacional en el futuro. Afectará la competitividad de un país. Y otros países como China han mostrado una dirección casi completamente opuesta en la IA.
Así que, sí, creo que esto es muy importante. Debemos enfrentarlo, y realmente debemos averiguar cómo asegurar que todos puedan beneficiarse de las ventajas de esta tecnología.
Alex:
Pero también estamos en un momento extremadamente inestable ahora mismo. La gente está muy preocupada por los trabajos. Cada vez que hablo con alguien sobre la IA, casi siempre preguntan: ¿Cuánto tiempo podré mantener mi trabajo?
Y luego, cuando se trata de centros de datos, la percepción del público sobre ellos es incluso peor que sobre la IA misma. Si miras estas encuestas de opinión pública, encontrarás que más personas creen que los centros de datos tendrán un impacto negativo en el medio ambiente, los costos de energía en el hogar y la calidad de vida de los residentes circundantes, en lugar de un impacto positivo.
Así que nos encontramos en un momento en el que los buenos trabajos son cada vez más difíciles de conseguir, y la gente ve que los centros de datos llegan a su comunidad y piensan: "Esta cosa no es respetuosa con el medio ambiente ni rentable en términos de energía, y reducirá nuestra calidad de vida".
¿Están equivocados?
Greg Brockman:
Creo que de hecho hay mucha desinformación en torno a los centros de datos.
Un ejemplo muy típico es el problema del uso del agua. Si realmente vas y miras nuestras instalaciones en Abilene, que es la más grande del mundo, o al menos una de las más grandes, instalaciones de supercomputación, su consumo total anual de agua es en realidad equivalente al de un hogar promedio durante un año. En otras palabras, el uso de agua es en realidad mínimo.
Pero hay mucha desinformación por ahí que lleva a la gente a creer que estos centros de datos consumen una gran cantidad de recursos hídricos.
La electricidad es una situación similar. Nos hemos comprometido a asumir los costos nosotros mismos y no trasladar la presión del aumento de los precios de la electricidad a los residentes. Esto es importante, y ahora toda la industria está comenzando a hacer compromisos similares porque mejorar la comunidad local es de hecho muy importante. Y cuando construimos un centro de datos, también nos involucramos verdaderamente con estas comunidades locales para entender qué está sucediendo localmente y qué podemos hacer para ayudar. Los centros de datos traen ingresos fiscales y crean empleos. Trae muchos beneficios.
Así que creo que la clave sigue siendo cómo nos presentamos, y esta es una responsabilidad que nos tomamos muy en serio.
Alex:
Vale, pero si las facturas de electricidad de los residentes no aumentan, todavía tienes que traer electricidad, lo que puede significar más contaminación. ¿No es eso un problema?
Greg Brockman:
Creo que de hecho hay muchas capas más finas en esto.
Si miras cómo opera la red eléctrica hoy, encontrarás que en realidad hay mucha "energía inactiva": es decir, mucha energía ya está allí pero no se está utilizando por completo. Al mismo tiempo, el sistema de transmisión en sí necesita actualizarse. Y la clave es que estos costos de actualización deberían ser asumidos por nosotros, no por los contribuyentes ordinarios, lo cual es muy importante. Hay muchos lugares donde hay energía limpia disponible, pero esta energía en realidad no se está utilizando por completo e incluso se está desperdiciando hasta cierto punto.
Así que, cuando llega la demanda de los centros de datos, en realidad trae un impulso real para actualizar esas redes envejecidas y obsoletas. Y esta actualización, de hecho, también trae beneficios reales a la comunidad. Por ejemplo, en Dakota del Norte, hemos visto que la construcción de un centro de datos local ha ayudado a mejorar la infraestructura de servicios públicos, lo que resulta en una disminución de los precios residenciales de la electricidad.
Alex:
Vale, una última pregunta política. Donaste 25 millones de dólares a MAGA Inc., que es un comité de acción política que apoya a Trump.
Greg Brockman:
Ya has discutido esto con Kara antes también.
NOTA: Kara Swisher, una destacada periodista tecnológica estadounidense, conocida por sus preguntas agudas y estilo directo, ha cubierto durante mucho tiempo Silicon Valley y las empresas de Internet.
Alex:
Correcto. Dijiste en ese momento: "Cualquier cosa que ayude a que esta tecnología realmente beneficie a todos, lo haré". Si esto te convierte en un "votante de un solo tema" o "donante de un solo tema", que así sea. Pero lo que siempre me he preguntado es: para este tipo de "campo de un solo tema", ¿no debería la Estrella del Norte definitiva de cualquier acción política ser "hacer que este país sea más fuerte" en sí mismo?
En otras palabras, incluso si un candidato no apoya completamente lo que estás haciendo, si pueden hacer que este país sea más fuerte, ¿no debería eso también ser un criterio clave para el apoyo político? Si es así, ¿es esto también parte de tu consideración de donación?
Greg Brockman:
Así es como lo veo: esa donación fue una decisión que mi esposa y yo tomamos juntos. También hemos donado a super PACs en ambos lados del pasillo.
Siento que esta tecnología viene muy rápido. En los próximos años, realmente cambiará todo y se convertirá en el sustento de toda la economía. Pero todavía no es popular. Así que queremos mucho apoyar a aquellas figuras políticas que están realmente dispuestas a abrazar esta tecnología, que realmente entienden esta tecnología.
Por supuesto, a un nivel más amplio, esta tecnología en sí misma está mejorando de hecho las capacidades de nuestro país. En cierto sentido, soy de hecho un "votante de un solo tema" porque creo que esta es el área donde puedo hacer una contribución única. Pero finalmente, esto sigue siendo sobre expresar un apoyo: como país, deberíamos abrazar proactivamente esta tecnología.
Competencia central futura: no usar IA, sino "gestionar la IA"
Alex:
Si hay alguien sentado frente a ti ahora mismo que tiene mucho miedo de la IA, pensando que la IA le quitará su trabajo, arruinará su comunidad, cambiará el mundo demasiado rápido, ¿qué les dirías?
Greg Brockman:
Lo único que más quiero decir es: ve y prueba estas herramientas por ti mismo. Porque solo cuando hayas experimentado realmente la IA que ya existe hoy, entenderás realmente lo que puede hacer por ti.
Y hoy ya hemos visto demasiadas oportunidades, potenciales y empoderamientos de esta tecnología. Acabas de decir lo que puedes hacer con ella ahora, ¿verdad? Las personas que nunca antes habían hecho un sitio web ahora pueden hacer uno; si quieres iniciar un pequeño negocio, anteriormente podrías haberte sentido abrumado por varios procesos de backend y detalles operativos, pero ahora la IA puede ayudarte con muchas de estas cosas.
Así que creo que, para tu propia vida, deberías pensar: ¿Puede ayudarte a gestionar tu salud? ¿Puede ayudarte a cuidar a tus seres queridos? ¿Puede ayudarte a ganar dinero? ¿Puede ayudarte a ahorrar dinero? Todas estas serán opciones reales.
Creo que la gente siempre encuentra más fácil ver "lo que cambiará" pero no tan fácil ver "lo que ganarán". Sin embargo, creo que vale la pena darle una oportunidad justa, para entender genuinamente lo que cada lado de la balanza representa realmente.
Alex:
Por cierto, este es también un punto que rara vez se discute en las encuestas. Aquellos que solo han "oído hablar de la IA" pero nunca la han usado realmente ellos mismos, o apenas han usado la IA, tienden a ser más negativos. Una vez que te conviertes en un usuario intensivo, o incluso solo en un usuario regular, tu visión de esta tecnología suele ser mucho más positiva.
Greg Brockman:
Para mí personalmente, hemos estado pensando en esta tecnología durante muchos años. Y ahora, la forma en que veo la realidad desarrollándose es incluso más asombrosa y beneficiosa de lo que imaginamos, y tendrá un impacto mucho más positivo de lo que esperábamos.
Alex:
Una última pregunta. Si alguien te pregunta: "¿Cómo debería prepararme para el futuro?" ¿cómo responderías?
Y esta respuesta no puede ser solo "ve a usar una herramienta". Porque realmente tengo amigos que vienen a mí y me preguntan: "No sé qué pasará con mi trabajo, no sé qué pasará con este mundo, solo quiero saber qué hacer ahora".
Greg Brockman:
Todavía creo que lo primero es entender esta tecnología. Hemos visto que aquellos que realmente se benefician más de esta tecnología son a menudo aquellos que la abordan con curiosidad. Realmente la integrarán en su flujo de trabajo, harán un esfuerzo por superar el umbral inicial: enfrentarse a un cuadro de entrada en blanco y esa sensación de "¿qué debería hacer siquiera con ella?".
Necesitas cultivar gradualmente un sentido de agencia: puedo ser un gerente; puedo establecer direcciones; puedo delegar tareas; puedo supervisar. Y necesitas desarrollar verdaderamente esta habilidad porque se convertirá en una habilidad muy fundamental.
Estamos construyendo esta tecnología para ayudar a la humanidad, para promover más conexiones entre humanos, para dar a las personas más tiempo para hacer lo que realmente quieren hacer. Entonces, la pregunta finalmente se convertirá en: ¿Qué quieres realmente? Y lo verdaderamente importante es aclarar esto y usar esta tecnología para lograrlo.
Alex:
Eso es correcto. Muchas gracias por venir al programa.
Greg Brockman:
Gracias por la invitación.
Alex:
Además, gracias a todos por escuchar y ver. Nos vemos la próxima vez en el Big Technology Podcast.
Te puede gustar

CEO de Sharplink: El futuro de Ethereum se está revelando

De herramientas de casino a máquinas de fijación de precios globales: la perspectiva del líder de la NYSE sobre Hyperliquid

¿Han sido los hackers y la regulación los que han arruinado las DeFi?

Chris Lee: De OG de las criptomonedas a grandes inversiones en los tres gigantes del almacenamiento, predicciones sobre correcciones en el mercado alcista de la IA, Web4 y oportunidades para las nuevas generaciones

He Yi: Ya que estás aquí, más vale intentarlo

Seis quejas principales de un desarrollador de Ethereum

WEEX GOGOGO EP3|LALIGA Camino al Oro – 6 momentos explosivos, 1 entrada para la Copa del Mundo y una noche inolvidable

¿2 años, 225 veces la rentabilidad? Revelando la misteriosa técnica de inversión de "cuello de botella" en IA del investigador Serenity

B.AI se asocia con BNB Chain para lanzar la celebración "Subsidio de Tokens de IA de Mil Millones", impulsando el ecosistema de agentes inteligentes on-chain

El frenesí del billón de dólares por vender memoria: los beneficios de comprarla se reducen a la mitad

Informe matutino | Binance lanza la herramienta de investigación DYOR; YZi Labs lanza la plataforma de contratación YZi Talent; Vitalik afirma que la Fundación Ethereum se "reducirá" y disminuirá la cantidad de ETH vendida

El sueño de exploración de Marte de SuperEx: la moneda digital es la clave para desbloquear los intercambios económicos en la era interestelar

Noticias de la mañana | Michael Saylor declaró que esta semana compró bonos en lugar de Bitcoin; StablR fue atacado y perdió cerca de 2,8 millones de dólares; el Congreso de EE. UU. vuelve a impulsar la Ley de Reserva de Bitcoin

Puntos clave: Texto completo del discurso del científico jefe de Google, Shanahan

Patrones de diseño de agentes: Un libro que me hizo replantearme "¿Qué es exactamente un agente?"

Ha llegado el presidente de la Reserva Federal más rico en 112 años: Kevin Warsh está reescribiendo las reglas

Vitalik habla sobre el futuro de la Ethereum Foundation: una nave más pequeña, más distintiva y más duradera

