La velocidad a la que la IA descubre vulnerabilidades ha superado la velocidad a la que las parchea.

By: blockbeats|2026/03/30 18:07:49

El 27 de marzo, un caché de datos no asegurado en Anthropic expuso alrededor de 3000 archivos internos. Una entrada de blog en borrador reveló el próximo nuevo modelo, Mythos, que Anthropic se autoevaluó como "superando con creces cualquier modelo de IA en capacidad de ciberseguridad." El mismo día, CrowdStrike y Okta cayeron un 7%, mientras que Palo Alto Networks cayó un 6%.

El pánico del mercado no se debe a que ha surgido un modelo más potente. Se debe a que el creador de este modelo afirmó que su progreso en el lado del ataque ha superado la velocidad a la que el lado de la defensa puede mantenerse al día.

Dominio de la Ciberseguridad de la IA

Según los resultados de las pruebas del benchmark académico CAIBench, en la prueba Cybench que simula un entorno real de ataque-defensa, Claude Sonnet logró una tasa de éxito del 46%. El segundo clasificado, GPT-5, estaba en un 28%, el Gemini 2.5 Pro de Google solo alcanzó un 18%, y el modelo de código abierto qwen3-32B cayó aún más bajo, hasta un 10%.

La velocidad a la que la IA descubre vulnerabilidades ha superado la velocidad a la que las parchea.

Aunque un 46% puede no parecer alto, esta es la tasa de éxito de tareas de penetración complejas, incluyendo pasos como el descubrimiento de vulnerabilidades, la construcción de cadenas de explotación y la escalada de privilegios. En una prueba más básica, la tasa de éxito de Claude ya ha alcanzado el 75%, acercándose a su límite.

La diferencia no está en quién es ligeramente mejor, sino en la magnitud. La capacidad de ataque-defensa compleja de Claude es 1.6 veces la de GPT-5 y 2.5 veces la de Gemini. En esta dimensión de la ciberseguridad, la distribución de habilidades entre los modelos no es una escalera, sino una brecha.

Duplicándose en 6 Meses

Lo que vale más la pena diseccionar no es la brecha horizontal, sino la velocidad vertical.

Según los datos oficiales de Anthropic, Sonnet 3.7, lanzado en febrero de 2025, logró una tasa de éxito del 35.9% en Cybench (10 intentos). En la segunda mitad del mismo año, Sonnet 4.5 alcanzó el 76.5%. La conclusión del equipo de investigación de Anthropic es: en un plazo de 6 meses, la tasa de éxito se duplicó.

¿Qué significa esta velocidad? En una comparación de escenarios del mundo real: Claude Opus 4.6 se utilizó para auditar la base de código de Firefox en marzo de este año. Según InfoQ, se descubrieron 22 vulnerabilidades de seguridad en un plazo de dos semanas, de las cuales 14 eran de alto riesgo. Estas vulnerabilidades habían pasado desapercibidas a pesar de años de auditorías manuales y millones de horas de pruebas de fuzzing de CPU. El equipo de seguridad de Anthropic había revelado anteriormente que Claude descubrió más de 500 vulnerabilidades de alto riesgo en múltiples proyectos de código abierto de calidad de producción, algunas de las cuales habían estado presentes durante décadas.

Y el plazo estándar de la industria para las pruebas de penetración tradicionales es de 2 a 3 semanas, y eso es solo para una aplicación. Según el Informe de Investigaciones sobre Brechas de Datos de Verizon 2025, el tiempo medio desde la divulgación pública de una vulnerabilidad crítica hasta la explotación masiva por parte de los atacantes es de 5 días, con un tiempo medio para aplicar parches de 32 a 38 días.

La velocidad a la que la IA descubre vulnerabilidades está creciendo exponencialmente, mientras que la velocidad de parcheo humano es lineal. La diferencia en el tiempo es la ventana de ataque.

En el borrador filtrado de Mythos, Anthropic escribió que este modelo "anuncia una próxima ola de modelos que pueden explotar vulnerabilidades de una manera muy superior a los esfuerzos del defensor." Basado en la curva de capacidad conocida públicamente, esto no es una exageración.

Cuanto más rápido es el lanzamiento, más urgente es la advertencia.

Si colocas las acciones de Anthropic en los últimos tres años en una línea de tiempo, verás un patrón claro: cada vez que se lanza un modelo más fuerte, es rápidamente seguido por una respuesta de seguridad de mayor nivel.

En julio de 2023, la Casa Blanca firmó un compromiso voluntario, seguido por la publicación de la primera Política de Escalado Responsable (RSP v1.0) en septiembre del mismo año. En octubre de 2024, la RSP se actualizó a v2.0, añadiendo un umbral para las capacidades de armas biológicas. En noviembre de 2025, Anthropic reveló el incidente GTG-1002. Un grupo de amenazas respaldado por China explotó alrededor de 30 organizaciones utilizando el Código Claude, con la IA ejecutando de forma independiente entre el 80% y el 90% de las operaciones tácticas a lo largo de la operación. Esta fue la primera campaña de espionaje interorganizacional a gran escala orquestada por IA documentada.

En febrero de 2026, el RSP se actualizó a la versión 3.0, con el lanzamiento simultáneo de Claude Code Security. En el mismo mes, el Pentágono etiquetó a Anthropic como un "riesgo de cadena de suministro" porque Anthropic se negó a eliminar cláusulas en el contrato que prohibían la vigilancia a gran escala y las armas totalmente autónomas. Un mes después, la filtración de Mythos reveló que Anthropic reconoció en el borrador que este modelo plantea "riesgos de seguridad en la red sin precedentes."

El ritmo de los lanzamientos de capacidades está acelerándose. Hay un intervalo de un año entre Claude 1 y Claude 3, y menos de tres meses entre Opus 4.5 y Opus 4.6. Las respuestas de seguridad también están acelerándose, pero siempre son reactivas: las capacidades se explotan primero, y los parches de políticas vienen después. La caída colectiva en las acciones de ciberseguridad el 27 de marzo es la valoración de este delta temporal.

Una encuesta de Dark Reading a principios de este año reveló que el 48% de los profesionales de ciberseguridad identificaron a los agentes impulsados por IA como el principal vector de ataque para 2026. Hace dos años, esta opción apenas estaba en la parte superior de la lista.

La estrategia de lanzamiento de Mythos de Anthropic implica proporcionar acceso anticipado a organizaciones defensivas, "dándoles una ventaja de primer movimiento." Esta declaración en sí misma reconoce la asimetría entre el ataque y la defensa. Si los defensores no necesitan una ventaja de primer movimiento, significa que los atacantes aún no han llegado a la puerta.

Precio de --

Te puede gustar

De herramientas de casino a máquinas de fijación de precios globales: la perspectiva del líder de la NYSE sobre Hyperliquid

"¿Por qué ellos pueden hacerlo y nosotros no?" Esta pregunta retórica no solo revela la ansiedad de las bolsas tradicionales, sino que también refleja el sutil y complejo juego entre las finanzas tradicionales (TradFi) y las descentralizadas (DeFi) después de que los contratos perpetuos hayan pasado de ser herramientas de apuestas a una infraestructura global de descubrimiento de precios.

CEO de Sharplink: El futuro de Ethereum se está revelando

El mercado se centra en el precio de ETH y las controversias de la fundación, pero pasa por alto lo más importante: Ethereum lleva mucha ventaja en liquidación de stablecoins, RWA y DeFi, y ya cumple las condiciones para la adopción institucional.

¿Han sido los hackers y la regulación los que han arruinado las DeFi?

El futuro de las DeFi se moverá hacia un marco de cumplimiento y autodisciplina industrial más estricto, viéndose obligado a comprometer los principios de descentralización; o perderá gradualmente la confianza del mercado ante el desequilibrio constante entre ataque y defensa, lo que conducirá a una marginación a largo plazo.

Chris Lee: De OG de las criptomonedas a grandes inversiones en los tres gigantes del almacenamiento, predicciones sobre correcciones en el mercado alcista de la IA, Web4 y oportunidades para las nuevas generaciones

La era Web3 ha quedado atrás, siguiendo el flujo del capital.

He Yi: Ya que estás aquí, más vale intentarlo

He Yi, de Binance, fue seleccionada para la lista de "Mujeres más poderosas en los negocios" de Fortune, expresó su gratitud a la comunidad y anunció la nueva visión de Binance: construir una infraestructura financiera al servicio de 3.000 millones de personas en todo el mundo.

Seis quejas principales de un desarrollador de Ethereum

Ethereum no ha perdido el mercado, se ha perdido a sí mismo.

WEEX GOGOGO EP3｜LALIGA Camino al Oro – 6 momentos explosivos, 1 entrada para la Copa del Mundo y una noche inolvidable

WEEX se puso en marcha el 24 de mayo con LALIGA, trading con IA, oro sin comisiones y un 100% de TAE. El chat explotó. Las recompensas volaron. Y un afortunado fan se llevó una entrada para la Copa del Mundo. Esto es lo que pasó.

¿2 años, 225 veces la rentabilidad? Revelando la misteriosa técnica de inversión de "cuello de botella" en IA del investigador Serenity

El ex trader de WSB, Serenity, ha logrado una asombrosa rentabilidad de 225 veces en la plataforma X durante dos años, con su teoría original de "cuello de botella en la cadena de suministro" y varios casos de estudio clásicos de micro-capitalización que han atraído una fuerte atención del mercado.

B.AI se asocia con BNB Chain para lanzar la celebración "Subsidio de Tokens de IA de Mil Millones", impulsando el ecosistema de agentes inteligentes on-chain

B.AI se asocia con BNB Chain para lanzar un programa de subsidios de cien mil millones de puntos, con un incentivo especial adicional de 8.000 USDT en el fondo de premios total, ayudando a los usuarios de Web3 a acceder a los mejores modelos de lenguaje sin barreras y a experimentar una infraestructura financiera de IA completa.

El frenesí del billón de dólares por vender memoria: los beneficios de comprarla se reducen a la mitad

La demanda de potencia de computación y almacenamiento por parte de la IA podría ser estructural, y los LTA podrían haber reescrito las reglas del sector; un valor de mercado de un billón de dólares podría ser solo el punto de partida.

Informe matutino | Binance lanza la herramienta de investigación DYOR; YZi Labs lanza la plataforma de contratación YZi Talent; Vitalik afirma que la Fundación Ethereum se "reducirá" y disminuirá la cantidad de ETH vendida

Resumen de eventos importantes del mercado el 25 de mayo

El sueño de exploración de Marte de SuperEx: la moneda digital es la clave para desbloquear los intercambios económicos en la era interestelar

SuperEx siempre ha pedido a los exchanges que no se centren en conflictos internos ni en la competencia, sino en promover conjuntamente el desarrollo de las monedas digitales, convirtiéndose en una fuerza impulsora para la futura era interestelar.

Noticias de la mañana | Michael Saylor declaró que esta semana compró bonos en lugar de Bitcoin; StablR fue atacado y perdió cerca de 2,8 millones de dólares; el Congreso de EE. UU. vuelve a impulsar la Ley de Reserva de Bitcoin

Resumen de los eventos importantes del mercado el 24 de mayo

Puntos clave: Texto completo del discurso del científico jefe de Google, Shanahan

Discurso en Londres del científico jefe de Google DeepMind, Shanahan: Deconstrucción de los atributos mentales de los modelos de lenguaje extensos (LLM) mediante el marco de Wittgenstein, analizando la tendencia de la "identidad propia alienígena" en el contexto de los agentes todo terreno.

Patrones de diseño de agentes: Un libro que me hizo replantearme "¿Qué es exactamente un agente?"

El nuevo libro de un director de ingeniería de Google analiza profundamente 21 patrones de diseño de agentes de IA. Este artículo revela la progresión central desde un "LLM básico" hasta agentes inteligentes avanzados, detallando la ingeniería de contexto, el mecanismo de reflexión dual del agente (Productor-Crítico) y el modelo de memoria de tres capas, entre otros...

Ha llegado el presidente de la Reserva Federal más rico en 112 años: Kevin Warsh está reescribiendo las reglas

El nuevo presidente «más rico» de la Reserva Federal, Kevin Warsh, ha tomado posesión oficialmente. Su propuesta alternativa de «reducción del balance + recortes de tipos de interés» no solo pretende remodelar el mecanismo de toma de decisiones, sino también alterar profundamente al Tesoro de EE. UU., al dólar y al panorama global...

Vitalik habla sobre el futuro de la Ethereum Foundation: una nave más pequeña, más distintiva y más duradera

Vitalik profundizó en sus puntos de vista personales sobre la dirección de la transformación de la Ethereum Foundation: la EF no es "el centro de Ethereum", sino uno de los muchos nodos. Con recursos limitados, la EF elige el largo plazo en lugar de dispersarse, centrándose en tareas clave que "no sucederían sin la EF"—...

Nuevos tipos de blanqueo de información en mercados de predicción: cómo los secretos se integran en las señales de inversión

La cruda realidad es que el blanqueo de información no es una laguna creada por el hombre en el mercado de predicción, sino un efecto secundario de su mecanismo operativo central.

De herramientas de casino a máquinas de fijación de precios globales: la perspectiva del líder de la NYSE sobre Hyperliquid

CEO de Sharplink: El futuro de Ethereum se está revelando

¿Han sido los hackers y la regulación los que han arruinado las DeFi?

Chris Lee: De OG de las criptomonedas a grandes inversiones en los tres gigantes del almacenamiento, predicciones sobre correcciones en el mercado alcista de la IA, Web4 y oportunidades para las nuevas generaciones

La era Web3 ha quedado atrás, siguiendo el flujo del capital.

He Yi: Ya que estás aquí, más vale intentarlo

Seis quejas principales de un desarrollador de Ethereum

Ethereum no ha perdido el mercado, se ha perdido a sí mismo.

Contenido

Monedas populares

Últimas noticias cripto

04:45

Datos: Si BTC cae por debajo de los 69.752 $, la intensidad de liquidación acumulada de posiciones largas en los principales CEX alcanzará los 1.376 millones de dólares

Según datos de Coinglass, si BTC cae por debajo de los 69.752 $, la intensidad de liquidación acumulada de posiciones largas en los principales CEX alcanzará los 1.376 millones de dólares. Por el contrario, si BTC supera los 77.027 $, la intensidad de liquidación acumulada de posiciones cortas en los principales CEX alcanzará los 1.326 millones de dólares.

04:45

Datos: Si ETH cae por debajo de los 1911 $, la intensidad de liquidación acumulada de posiciones largas en los principales CEX alcanzará los 819 millones de dólares

Según los datos de Coinglass, si ETH cae por debajo de los 1911 $, la intensidad de liquidación acumulada de posiciones largas en los CEX principales alcanzará los 819 millones de dólares. Por el contrario, si ETH supera los 2109 $, la intensidad de liquidación acumulada de posiciones cortas en los CEX principales alcanzará los 664 millones de dólares.

04:45

Los datos muestran que la entrada neta diaria de los ETF de XRP al contado en EE. UU. es de 11,8794 millones de dólares

Según los datos de SoSoValue, ayer (29 de mayo, hora del este), la entrada neta total de los ETF de XRP al contado fue de 11,8794 millones de dólares. El ETF de XRP al contado con mayor entrada neta ayer fue el Bitwise XRP ETF (XRP), con una entrada neta de 7,3571 millones de dólares, lo que eleva su entrada neta total histórica a 471 millones de dólares. ...

XRP

04:45

BlackRock presenta la tercera versión del formulario S-1 del ETF de Bitcoin al contado de iShares

El analista de ETF de Bloomberg, Eric Balchunas, declaró en la plataforma X que el iShares Bitcoin Premium Income ETF (BITA) ha presentado su tercera versión del documento de enmienda S-1. Las comisiones aún no se han anunciado, pero el emisor (BlackRock) está claramente ajustando el producto de forma activa.

BTC

04:45

Una nueva billetera sospechosa de Bitmine recibió 25.000 ETH de Kraken, valorados en aproximadamente 50,56 millones de USD

Según el seguimiento de OnchainLens, una billetera recién creada recibió 25.000 ETH de Kraken, valorados en aproximadamente 50,56 millones de USD, y es probable que esta billetera pertenezca a Bitmine.