¿Pueden los agentes de IA mejorar la seguridad de Ethereum? OpenAI y Paradigm crean terreno de prueba
Puntos Clave
- OpenAI y Paradigm han lanzado EVMbench, una herramienta diseñada para evaluar la capacidad de los agentes de inteligencia artificial en la detección, corrección y explotación de vulnerabilidades graves en los contratos inteligentes de Ethereum.
- EVMbench se basa en 120 vulnerabilidades cuidadosamente seleccionadas de 40 auditorías, la mayoría obtenidas de competiciones de auditoría abiertas como Code4rena.
- El objetivo de esta herramienta es enraizar las pruebas en código real con significado económico, particularmente a medida que se expanden los pagos con stablecoins impulsados por la inteligencia artificial.
- A pesar de sus limitaciones, EVMbench representa un avance importante en la medición del rendimiento de la IA en entornos económicamente relevantes.
WEEX Crypto News, 2026-02-19 09:43:01
Introducción a EVMbench: Un punto de partida para la seguridad de Ethereum
En una colaboración innovadora, OpenAI y la firma de inversión centrada en criptomonedas, Paradigm, han lanzado EVMbench. Esta plataforma única está diseñada para evaluar qué tan capaces son los agentes de inteligencia artificial para identificar y remediar vulnerabilidades en los contratos inteligentes de la Ethereum Virtual Machine (EVM). Los contratos inteligentes son el núcleo del ecosistema Ethereum, ya que contienen el código que impulsa desde los protocolos de finanzas descentralizadas hasta el lanzamiento de tokens.
El auge de los contratos inteligentes en Ethereum
La importancia de proteger los contratos inteligentes se destaca por el dramático aumento en su implementación. Según Token Terminal, en noviembre de 2025 se alcanzó un récord histórico de 1.7 millones de contratos inteligentes implementados semanalmente en Ethereum, y solo la semana pasada se desplegaron 669,500. Este crecimiento no solo refleja la expansión de Ethereum, sino también la creciente necesidad de garantizar la seguridad del ecosistema.
¿Qué es EVMbench?
EVMbench examina tres modos de operación para los modelos de IA: detección, parcheo y explotación. En el modo de “detección”, los agentes auditan repositorios y son evaluados en base a su capacidad para recordar las vulnerabilidades reales. El modo “parcheo” desafía a los agentes a eliminar vulnerabilidades sin alterar la funcionalidad prevista del contrato. Finalmente, durante la fase de “explotación”, los agentes intentan realizar ataques que drenan fondos de extremo a extremo dentro de un entorno de blockchain aislado, con la evaluación realizada a través de la reproducción determinista de transacciones.
En condiciones de explotación, el modelo GPT-5.3-Codex de OpenAI, ejecutado a través del CLI de OpenAI Codex, alcanzó un puntaje del 72.2%, en comparación con el 31.9% de GPT-5, lanzado seis meses antes. Sin embargo, los resultados fueron menos impresionantes en las tareas de detección y parcheo, donde los agentes a veces no lograron realizar auditorías exhaustivas o tuvieron dificultades para preservar la funcionalidad completa del contrato.
Proceso de creación de EVMbench
EVMbench se fundamenta en 120 vulnerabilidades seleccionadas de 40 auditorías, principalmente extraídas de competiciones de auditoría abiertas como Code4rena. Además, incorpora escenarios del proceso de auditoría de seguridad de Tempo, una blockchain de capa 1 diseñada por Stripe para pagos de stablecoin de alto rendimiento y bajo costo. Stripe, el gigante de los pagos, lanzó la red de pruebas pública para Tempo en diciembre de 2025, señalando que se estaba desarrollando con la colaboración de Visa, Shopify y OpenAI, entre otros.
El objetivo declarado de EVMbench es arraigar las pruebas en código con relevancia económica en el mundo real. Esto es especialmente crítico a medida que los pagos de stablecoins impulsados por inteligencia artificial continúan expandiéndose y adquiriendo relevancia.
Desafíos y oportunidades
Si bien los desarrolladores de ChatGPT aconsejan que EVMbench no captura completamente la complejidad de la seguridad en el mundo real, reconocen su importancia en la medición del rendimiento de la IA en entornos económicamente relevantes. Este tipo de herramientas se vuelve cada vez más crucial a medida que los modelos de inteligencia artificial se convierten en herramientas poderosas tanto para atacantes como para defensores.
Un debate en torno al desarrollo de la IA
Cabe destacar que Sam Altman de OpenAI y Vitalik Buterin, cofundador de Ethereum, han tenido diferencias sobre la velocidad del desarrollo de la inteligencia artificial. En enero de 2025, Altman afirmó que su empresa estaba “segura de saber cómo construir inteligencia general artificial (AGI) como siempre la hemos entendido”. Sin embargo, Buterin abogó por que los sistemas de IA incluyan una capacidad de “pausa suave”, que podría restringir temporalmente las operaciones industriales de IA si surgen señales de advertencia.
EVMbench: Relevancia y perspectivas para el futuro
La introducción de EVMbench como nuevo punto de referencia para evaluar la aptitud de los agentes de IA en la detección, explotación y corrección de vulnerabilidades en los contratos inteligentes es un paso significativo hacia la mejora de la seguridad en Ethereum. Esencialmente, EVMbench no solo tiene como objetivo evaluar las capacidades de los agentes de IA, sino también cerrar la brecha entre las expectativas teóricas y el rendimiento práctico.
Toda la estructura de EVMbench está diseñada para asegurarse de que las pruebas no solo sean técnicamente sólidas, sino también económicamente significativas. El enfoque en el uso de código de relevancia real asegura que las evaluaciones realizadas sean más que ejercicios académicos, resonando directamente con los desafíos que enfrenta la seguridad en blockchain de Ethereum diariamente.
¿Por qué es importante asegurar los contratos inteligentes?
Los contratos inteligentes son inmutables, es decir, una vez desplegados, no se pueden modificar a menos que ya se haya previsto un mecanismo de actualización. Esto los hace poderosos y peligrosos. Un error en el código no solo es irreversible sino que puede resultar en pérdidas millonarias. Por ejemplo, se han dado casos de bugs explotados por hackers que han drenado miles de millones de dólares en pérdidas en diversas plataformas. De ahí que el desarrollo de herramientas como EVMbench sea crucial para la proactividad en la prevención de exploits.
Retos en el uso de la inteligencia artificial para la seguridad
A pesar de su potencial, las IA enfrentan varios retos cuando se emplean para la seguridad. Primero, las IA dependen de un conjunto de datos extenso y diverso para entrenarse adecuadamente, lo cual no siempre está disponible. Además, al igual que cualquier sistema, las IA pueden cometer errores. Un proceso de detección que no logre identificar defectos o un sistema de parche que altere la funcionalidad correcta del contrato, son riesgos inherentes que deben gestionarse cuidadosamente.
Sin embargo, el potencial de la inteligencia artificial para transformar el campo de la seguridad es inmenso. AI puede trabajar a velocidades, escalas y eficiencias que simplemente son inalcanzables para los auditores humanos.
Hacia un futuro más seguro en blockchain
La mejora continua de herramientas como EVMbench, junto con un paradigma creciente de colaboración entre entidades como OpenAI y líderes de la industria como Stripe, marca el camino hacia un futuro más seguro. Además, el diálogo sobre las implicaciones éticas y de seguridad del desarrollo de la inteligencia artificial, como el presenciado entre Altman y Buterin, asegura que los avances se realicen de manera responsable.
En última instancia, la garantía de seguridad que tiende la IA en el ámbito de Ethereum no solo dependerá de los algoritmos y complejos modelos de IA, sino también de una colaboración continua y una visión cohesionada para proteger la columna vertebral del sistema financiero descentralizado.
Preguntas Frecuentes
¿Qué es EVMbench?
EVMbench es una herramienta creada por OpenAI y Paradigm para evaluar la capacidad de los agentes de inteligencia artificial para detectar, explotar y corregir vulnerabilidades graves en los contratos inteligentes de la Ethereum Virtual Machine (EVM).
¿Por qué es importante la seguridad de los contratos inteligentes?
Los contratos inteligentes, una vez desplegados, son inmutables. Un error en el código puede llevar a pérdidas importantes, por lo que es crucial asegurar su correcto funcionamiento desde su creación.
¿Cuáles son las pruebas realizadas por EVMbench?
EVMbench evalúa a los agentes de IA en tres modos: detección de vulnerabilidades, parcheo (corrección) de vulnerabilidades sin romper la funcionalidad, y explotación de las mismas en un entorno seguro.
¿Cuál es la relevancia del uso de IA en la seguridad de blockchain?
El uso de IA para la seguridad en blockchain permite la identificación y corrección de vulnerabilidades a una velocidad y escala que supera las capacidades humanas, ayudando a proteger plataformas económicas críticas.
¿Qué papel juega Stripe en el desarrollo de EVMbench?
Stripe, junto con otros colaboradores como Visa, Shopify y OpenAI, ha jugado un papel en el desarrollo de Tempo, un blockchain que proporciona ejemplos de vulnerabilidades utilizados en EVMbench para pruebas significativas en el mundo real.
También te puede gustar

¿Subirá el precio de Solana a $100 si Bitcoin recupera los $72K?
Key Takeaways El precio de Solana experimentó un incremento del 13% en las últimas 24 horas, reforzando expectativas…

El juez de EE.UU. permite que avance la demanda colectiva por tokens no registrados de Binance
Puntos clave Un juez de EE.UU. rechazó el intento de Binance de forzar un arbitraje, permitiendo que una…

Error de la Agencia Tributaria Nacional de Corea del Sur Resulta en Pérdida de Criptomonedas por 4.8 Millones de Dólares
Key Takeaways La Agencia Tributaria Nacional de Corea del Sur publicó por error fotos sin censura de frases…

Vitalik Drops Ethereum Endgame Bombshell: ETH USD a $3,000?
Key Takeaways: Vitalik Buterin ha introducido el concepto de “tecnologías de santuario” para Ethereum, enfocado en la resistencia…

Fuerte Aumento de las Inversiones en ETFs de Altcoins: SOL y XRP Atraen $23M Mientras las Instituciones Diversifican
El interés institucional en las altcoins SOL y XRP se ha incrementado notablemente, con flujos importantes en ETFs…

iPhone Crypto Wallets Under Siege: An In-Depth Analysis of the Coruna Exploit Kit
Key Takeaways Emergence of Coruna Exploit Kit: This sophisticated malware targets iPhone users through 23 iOS vulnerabilities, breaching…

Exclusive: Yuliya Barabash Opina que los Mayores Beneficiados del Próximo Ciclo Cripto Podrían Ser los Más Regulados
Key Takeaways La quiebra de firmas cripto como FTX y Celsius impulsó el avance regulatorio global. Los inversionistas…

Bitcoin Cerca del ‘Punto de Resistencia’ de Dos Años: ¿Qué Sigue?
Puntos Clave Bitcoin está enfrentando un nivel de resistencia crítico: Se encuentra cerca de los $73,000, un punto…

Bitcoin Price Prediction: Analyst Indicates $220,000 BTC Is Approaching — But With Conditions
La perspectiva a corto plazo de Bitcoin sigue siendo bajista, pero los analistas predicen un repunte importante a…

Solana Price Prediction: Todos los Ojos en $95 — ¿Lanzará Este Nivel a SOL Hacia Nuevas Alturas?
Key Takeaways Solana se acerca a un nivel crítico de $95, lo que podría definir el rumbo futuro…

Bitcoin Price Prediction: Fed Rate Cut Hints Boost BTC Past $72K — Is a Major Rally Emerging?
Las expectativas de que la Reserva Federal reduzca las tasas de interés impulsan a Bitcoin por encima de…

Predicción de Precio de XRP: Ripple Recurre a la IA para Proteger el XRP Ledger — ¿Un Cambio de Juego en Seguridad?
Ripple incorpora herramientas de inteligencia artificial para mejorar la seguridad del XRP Ledger. Un reciente error en la…

Predicción de Claude AI: El Precio de XRP, Solana y Cardano para Fin de 2026
Puntos Clave Claude AI predice un aumento significativo en los valores de XRP, Solana y Cardano para finales…

Predicción del Precio de Criptomonedas Hoy 4 de Marzo: XRP, Bitcoin, Ethereum
Key Takeaways: XRP, Bitcoin y Ethereum son las criptomonedas que más pueden beneficiarse con la posible aprobación del…

Servicio de Impuestos de Corea del Sur Filtra Frases Semilla y Pierde $4.8 Millones en Cripto
Key Takeaways La agencia fiscal de Corea del Sur sufrió una pérdida significativa al filtrar frases semilla de…

Noticias sobre la Ley CLARITY: La Administración Trump desafía a los Bancos por el Acceso a Bancos Cripto
Key Takeaways: La administración de Trump está presionando a los bancos que obstaculizan el avance de las criptomonedas…

Acumulación Institucional: ETFs de Bitcoin de EE.UU. y MicroStrategy Impulsan una Fuerte Alza de $1.2B
Puntos Clave Un aumento significativo de la demanda institucional ha añadido más de $1.7 mil millones en Bitcoin…

¿Por qué Crypto Está en Alza? Bitcoin Recupera $71,000 Mientras el Mercado Ignora la Escalada en Medio Oriente
Key Takeaways Bitcoin experimentó una fuerte recuperación en forma “V”, alcanzando los $71,000 después de una caída al…
¿Subirá el precio de Solana a $100 si Bitcoin recupera los $72K?
Key Takeaways El precio de Solana experimentó un incremento del 13% en las últimas 24 horas, reforzando expectativas…
El juez de EE.UU. permite que avance la demanda colectiva por tokens no registrados de Binance
Puntos clave Un juez de EE.UU. rechazó el intento de Binance de forzar un arbitraje, permitiendo que una…
Error de la Agencia Tributaria Nacional de Corea del Sur Resulta en Pérdida de Criptomonedas por 4.8 Millones de Dólares
Key Takeaways La Agencia Tributaria Nacional de Corea del Sur publicó por error fotos sin censura de frases…
Vitalik Drops Ethereum Endgame Bombshell: ETH USD a $3,000?
Key Takeaways: Vitalik Buterin ha introducido el concepto de “tecnologías de santuario” para Ethereum, enfocado en la resistencia…
Fuerte Aumento de las Inversiones en ETFs de Altcoins: SOL y XRP Atraen $23M Mientras las Instituciones Diversifican
El interés institucional en las altcoins SOL y XRP se ha incrementado notablemente, con flujos importantes en ETFs…
iPhone Crypto Wallets Under Siege: An In-Depth Analysis of the Coruna Exploit Kit
Key Takeaways Emergence of Coruna Exploit Kit: This sophisticated malware targets iPhone users through 23 iOS vulnerabilities, breaching…