Xiaomi y MiniMax lanzan sus mejores armas, lo que marca el inicio de la guerra de precios entre los agentes.
Los días 18 y 19 de marzo, dos empresas chinas presentaron sucesivamente sus respectivos modelos a gran escala orientados a agentes. La startup china de IA MiniMax ha lanzado M2.7, y el equipo de modelos a gran escala de Xiaomi, MiMo, ha presentado V2-Pro. Ambos modelos se situaron entre los mejores del mundo en la prueba de rendimiento de Agent, pero el coste por respuesta de su API es, respectivamente, 1/21 y 1/8 del de Claude Opus 4.6.
Ambas empresas jugaron sus cartas esa misma semana, pero con manos completamente diferentes. Representan dos caminos técnicos completamente diferentes, apostando por dos futuros de la era de los agentes.
Mismo examen, matrícula del 17 de enero
En primer lugar, veamos la comparación más intuitiva.

Según OpenRouter y diversas páginas oficiales de precios de la empresa, basándose en el precio de salida de la API (por millón de tokens), el MiniMax M2.7 cuesta 1,2 $ y el MiMo-V2-Pro, 3 $. A modo de referencia, el precio de venta de Claude Opus 4.6 es de 25 dólares, el de GPT-5.2 es de 14 dólares y el de Claude Sonnet 4.6 es de 15 dólares.
La diferencia de precio es de un orden de magnitud, pero la diferencia de rendimiento no lo es. En SWE-bench Verified (el benchmark más utilizado actualmente para medir la capacidad de ingeniería de código), MiMo-V2-Pro obtuvo una puntuación del 78 %, mientras que Sonnet 4.6 alcanzó el 79,6 %, lo que supone una diferencia de menos de dos puntos porcentuales. La puntuación SWE-Pro de M2.7 es del 56,22 %, a la par con la de GPT-5.3-Codex. En VIBE-Pro (capacidad de ejecución integral de proyectos), M2.7 obtuvo una puntuación del 55,6 %, acercándose al nivel de Opus 4.6.
El objetivo de este gráfico no es determinar quién está por encima o por debajo: los sistemas de referencia de las distintas empresas no están totalmente alineados, por lo que las comparaciones directas deben hacerse con cautela. La atención se centra en la «diferencia de precios y prestaciones»: los modelos nacionales de Agent se han situado en el mismo nivel de prestaciones, pero se encuentran en rangos de precios totalmente distintos.
Trillones de parámetros frente a Autoevolución
El precio es solo la punta del iceberg. Las dos empresas han presentado dos series de bazas completamente diferentes.
MiMo-V2-Pro apuesta por ir a lo grande. Según el comunicado oficial de Xiaomi, V2-Pro cuenta con más de un billón de parámetros en total, 42 000 millones de parámetros de activación y admite un contexto ultralargo de un millón de tokens. Su principal innovación es el mecanismo de atención mixta «Hybrid Attention», que ajusta la proporción entre la atención de ventana deslizante (SWA) y la atención global (GA) a 7:1; su predecesor, V2-Flash, tenía una proporción de 5:1. Esta arquitectura hace que el modelo sea más estable en situaciones en las que se procesan documentos largos y se realizan múltiples llamadas paralelas a herramientas en el entorno del agente. En PinchBench (evaluación de la capacidad de invocación de herramientas de agente), MiMo-V2-Pro obtuvo una puntuación del 84 %.
M2.7 tomó un camino completamente diferente. Según la entrada publicada el 18 de marzo en el blog técnico oficial de MiniMax, no se reveló el número de parámetros de M2.7, pero se demostró que este modelo cuenta con un mecanismo de «evolución autoiterativa»: el modelo ejecutó de forma autónoma más de 100 ciclos de optimización, lo que incluyó el análisis de trayectorias de fallo, la planificación de modificaciones, la modificación de su propia arquitectura de código, la realización de evaluaciones y la repetición del ciclo, logrando finalmente una mejora del rendimiento del 30 % en un conjunto de datos de evaluación interno. En el MLE Bench Lite (evaluación de la dificultad de los concursos de aprendizaje automático), de los 22 problemas más difíciles, M2.7 consiguió 9 medallas de oro, 5 de plata y 1 de bronce, con una tasa media de medallas del 66,6 %.

Desde una perspectiva de cinco dimensiones, los dos caminos apuntan en direcciones completamente opuestas: MiMo-V2-Pro destaca claramente en cuanto a la longitud del contexto y la ingeniería del código, mientras que M2.7 amplía la ventaja en materia de ofimática y capacidad de iteración autónoma. Según la misma entrada del blog técnico de MiniMax, M2.7 obtuvo una puntuación ELO de 1495 en GDPval-AA (evaluación del procesamiento de documentos de Office), situándose en primer lugar entre los modelos de código abierto, y mantuvo una tasa de cumplimiento de habilidades del 97 % en la prueba MM-Claw, que abarca más de 40 habilidades complejas.
Cuatro versiones en cinco meses
No solo son diferentes las estrategias técnicas de ambas empresas, sino que sus ritmos de desarrollo también son totalmente distintos.
Según los registros públicos de lanzamientos, desde el lanzamiento de la versión M2 en octubre de 2025 hasta el de la versión M2.7 en marzo de 2026, MiniMax lanzó cuatro versiones en cinco meses, lo que supone una media de una versión principal cada 49 días. La diferencia entre el M2.5 y el M2.7 fue de solo unos 30 días.
El ritmo del MiMo de Xiaomi es diferente: MiMo-7B se lanzó en abril de 2025 (un modelo de inferencia de código abierto con 7 000 millones de parámetros), V2-Flash se lanzó en diciembre del mismo año (con un total de 309 000 millones de parámetros) y V2-Pro se lanzó en marzo de 2026 (con un total de 1 billón de parámetros). La escala de parámetros entre cada generación es mucho mayor, pero los intervalos entre versiones también son más largos.
MiniMax optó por dar pasos pequeños y frecuentes, de modo que cada iteración no supusiera grandes avances, sino que se realizara a un ritmo muy elevado. El propio mecanismo de iteración interna de M2.7 está diseñado para una «evolución continua». Xiaomi optó por un enfoque más impactante, en el que cada versión presenta cambios significativos en cuanto a la escala de parámetros y la arquitectura.

Anónimo 8 días, Summit OpenRouter
Además de la hoja de ruta técnica, la estrategia de lanzamiento de Xiaomi también ha roto con las convenciones del sector.
Según Reuters, el 11 de marzo apareció una modelo anónima llamada Hunter Alpha en OpenRouter, la mayor plataforma de agregación de API del mundo. Sin promoción de marcas, sin eventos de lanzamiento de productos, sin blogs técnicos. El precio de su API era extremadamente bajo, pero su rendimiento era sorprendentemente bueno.
La comunidad empezó a especular sobre sus orígenes. Según Republic World y varios medios especializados en tecnología, la hipótesis más extendida apuntaba a DeepSeek V4, ya que Luo Fuli, jefe del equipo MiMo, había trabajado anteriormente en proyectos de investigación en DeepSeek. El número de llamadas a la API se disparó rápidamente, y el total de llamadas durante el periodo de anonimato superó el billón de tokens, lo que le valió el primer puesto en la clasificación semanal de OpenRouter.

En la madrugada del 19 de marzo, Xiaomi reveló: Hunter Alpha es, efectivamente, MiMo-V2-Pro. Según el mismo informe de Reuters, las acciones de Xiaomi en Hong Kong se dispararon un 5,8 % tras conocerse la noticia.
Es la primera vez que un modelo nacional a gran escala ha demostrado su eficacia en una plataforma mundial mediante pruebas ciegas. Sin depender de la marca ni de la publicidad, se tardó ocho días en que los desarrolladores votaran con los pies.
También te puede gustar

La IA empieza a revolucionar el sector manufacturero | Rewire News, edición matutina

Cuando la escalabilidad se une a la velocidad, la Fundación Ethereum introduce la "dureza" para salvaguardar la capa base.

Google, Circle, Stripe se unen para permitir que la IA gaste dinero: Las alegrías y preocupaciones de los gigantes del pago en el primer trimestre de 2026

Compra de fábrica por $100.000 millones: Bezos y el capital de Oriente Medio trasladan el dinero de la IA de la nube al suelo de la tienda

Los mercados de predicción han llamado la atención, pero el Perp DEX ha estado librando una guerra silenciosa contra los intercambios tradicionales.

¿Sigue generando millones al día la caída del mercado? ¿Son reales los ingresos de pump.fun?

Todo lo que hay que saber sobre x402 y MPP en un solo artículo: Las dos vías de pago a los agentes

Un vistazo rápido a los últimos 18 proyectos de fin de carrera de Alliance: ¿Quién será el próximo Pump.fun?

No es solo el mercado de predicciones el que se beneficia de la guerra de Irak.

Informe matutino | Bitwise adquiere Chorus One; Circle anuncia el rendimiento del cuarto trimestre de 2025 y del año completo; Stripe inicia la recompra de acciones con una valoración de 159.000 millones de dólares

¿El 99 % de los tokens quedarán en cero?

Diálogo de Vitalik en Chiang Mai: La explosión de la inteligencia artificial, ¿por qué debería luchar el mundo de las criptomonedas?

La "tarjeta bancaria" de la IA ha llamado la atención de los gigantes

Noticias de la mañana | Estados Unidos La SEC aprueba la negociación de tokens en Nasdaq; Animoca Brands anuncia una inversión en tokens AVAX; la Fundación Algorand completa su integración estratégica.

La Última Entrevista del CEO de Circle: Las Stablecoins No Son Criptomonedas
Circle completó su salida a bolsa en 2025, convirtiéndose en una de las listas más destacadas de la…

NVIDIA GTC Comienza la Próxima Semana con 30,000 Asistentes de 190 Países
Se espera que la conferencia NVIDIA GTC 2026 atraiga a más de 30,000 participantes de todo el mundo.…

Aave Implementará la Función Aave Shield para Proteger las Swaps
Aave lanzará la función Aave Shield para bloquear Swaps con impacto de precio superior al 25%. En un…

¿Qué ventajas competitivas aún se pueden defender en la era de la IA?
Puntos Clave Las habilidades tradicionales de programación están desapareciendo gradualmente a medida que la IA asume la creación…