Xiaomi y MiniMax lanzan sus mejores armas, lo que marca el inicio de la guerra de precios entre los agentes.

By: blockbeats|2026/03/20 13:30:09
0
Compartir
copy

Los días 18 y 19 de marzo, dos empresas chinas presentaron sucesivamente sus respectivos modelos a gran escala orientados a agentes. La startup china de IA MiniMax ha lanzado M2.7, y el equipo de modelos a gran escala de Xiaomi, MiMo, ha presentado V2-Pro. Ambos modelos se situaron entre los mejores del mundo en la prueba de rendimiento de Agent, pero el coste por respuesta de su API es, respectivamente, 1/21 y 1/8 del de Claude Opus 4.6.

Ambas empresas jugaron sus cartas esa misma semana, pero con manos completamente diferentes. Representan dos caminos técnicos completamente diferentes, apostando por dos futuros de la era de los agentes.

Mismo examen, matrícula del 17 de enero

En primer lugar, veamos la comparación más intuitiva.

Xiaomi y MiniMax lanzan sus mejores armas, lo que marca el inicio de la guerra de precios entre los agentes.

Según OpenRouter y diversas páginas oficiales de precios de la empresa, basándose en el precio de salida de la API (por millón de tokens), el MiniMax M2.7 cuesta 1,2 $ y el MiMo-V2-Pro, 3 $. A modo de referencia, el precio de venta de Claude Opus 4.6 es de 25 dólares, el de GPT-5.2 es de 14 dólares y el de Claude Sonnet 4.6 es de 15 dólares.

La diferencia de precio es de un orden de magnitud, pero la diferencia de rendimiento no lo es. En SWE-bench Verified (el benchmark más utilizado actualmente para medir la capacidad de ingeniería de código), MiMo-V2-Pro obtuvo una puntuación del 78 %, mientras que Sonnet 4.6 alcanzó el 79,6 %, lo que supone una diferencia de menos de dos puntos porcentuales. La puntuación SWE-Pro de M2.7 es del 56,22 %, a la par con la de GPT-5.3-Codex. En VIBE-Pro (capacidad de ejecución integral de proyectos), M2.7 obtuvo una puntuación del 55,6 %, acercándose al nivel de Opus 4.6.

El objetivo de este gráfico no es determinar quién está por encima o por debajo: los sistemas de referencia de las distintas empresas no están totalmente alineados, por lo que las comparaciones directas deben hacerse con cautela. La atención se centra en la «diferencia de precios y prestaciones»: los modelos nacionales de Agent se han situado en el mismo nivel de prestaciones, pero se encuentran en rangos de precios totalmente distintos.

Trillones de parámetros frente a Autoevolución

El precio es solo la punta del iceberg. Las dos empresas han presentado dos series de bazas completamente diferentes.

MiMo-V2-Pro apuesta por ir a lo grande. Según el comunicado oficial de Xiaomi, V2-Pro cuenta con más de un billón de parámetros en total, 42 000 millones de parámetros de activación y admite un contexto ultralargo de un millón de tokens. Su principal innovación es el mecanismo de atención mixta «Hybrid Attention», que ajusta la proporción entre la atención de ventana deslizante (SWA) y la atención global (GA) a 7:1; su predecesor, V2-Flash, tenía una proporción de 5:1. Esta arquitectura hace que el modelo sea más estable en situaciones en las que se procesan documentos largos y se realizan múltiples llamadas paralelas a herramientas en el entorno del agente. En PinchBench (evaluación de la capacidad de invocación de herramientas de agente), MiMo-V2-Pro obtuvo una puntuación del 84 %.

M2.7 tomó un camino completamente diferente. Según la entrada publicada el 18 de marzo en el blog técnico oficial de MiniMax, no se reveló el número de parámetros de M2.7, pero se demostró que este modelo cuenta con un mecanismo de «evolución autoiterativa»: el modelo ejecutó de forma autónoma más de 100 ciclos de optimización, lo que incluyó el análisis de trayectorias de fallo, la planificación de modificaciones, la modificación de su propia arquitectura de código, la realización de evaluaciones y la repetición del ciclo, logrando finalmente una mejora del rendimiento del 30 % en un conjunto de datos de evaluación interno. En el MLE Bench Lite (evaluación de la dificultad de los concursos de aprendizaje automático), de los 22 problemas más difíciles, M2.7 consiguió 9 medallas de oro, 5 de plata y 1 de bronce, con una tasa media de medallas del 66,6 %.

Desde una perspectiva de cinco dimensiones, los dos caminos apuntan en direcciones completamente opuestas: MiMo-V2-Pro destaca claramente en cuanto a la longitud del contexto y la ingeniería del código, mientras que M2.7 amplía la ventaja en materia de ofimática y capacidad de iteración autónoma. Según la misma entrada del blog técnico de MiniMax, M2.7 obtuvo una puntuación ELO de 1495 en GDPval-AA (evaluación del procesamiento de documentos de Office), situándose en primer lugar entre los modelos de código abierto, y mantuvo una tasa de cumplimiento de habilidades del 97 % en la prueba MM-Claw, que abarca más de 40 habilidades complejas.

Cuatro versiones en cinco meses

No solo son diferentes las estrategias técnicas de ambas empresas, sino que sus ritmos de desarrollo también son totalmente distintos.

Según los registros públicos de lanzamientos, desde el lanzamiento de la versión M2 en octubre de 2025 hasta el de la versión M2.7 en marzo de 2026, MiniMax lanzó cuatro versiones en cinco meses, lo que supone una media de una versión principal cada 49 días. La diferencia entre el M2.5 y el M2.7 fue de solo unos 30 días.

El ritmo del MiMo de Xiaomi es diferente: MiMo-7B se lanzó en abril de 2025 (un modelo de inferencia de código abierto con 7 000 millones de parámetros), V2-Flash se lanzó en diciembre del mismo año (con un total de 309 000 millones de parámetros) y V2-Pro se lanzó en marzo de 2026 (con un total de 1 billón de parámetros). La escala de parámetros entre cada generación es mucho mayor, pero los intervalos entre versiones también son más largos.

MiniMax optó por dar pasos pequeños y frecuentes, de modo que cada iteración no supusiera grandes avances, sino que se realizara a un ritmo muy elevado. El propio mecanismo de iteración interna de M2.7 está diseñado para una «evolución continua». Xiaomi optó por un enfoque más impactante, en el que cada versión presenta cambios significativos en cuanto a la escala de parámetros y la arquitectura.

Precio de --

--

Anónimo 8 días, Summit OpenRouter

Además de la hoja de ruta técnica, la estrategia de lanzamiento de Xiaomi también ha roto con las convenciones del sector.

Según Reuters, el 11 de marzo apareció una modelo anónima llamada Hunter Alpha en OpenRouter, la mayor plataforma de agregación de API del mundo. Sin promoción de marcas, sin eventos de lanzamiento de productos, sin blogs técnicos. El precio de su API era extremadamente bajo, pero su rendimiento era sorprendentemente bueno.

La comunidad empezó a especular sobre sus orígenes. Según Republic World y varios medios especializados en tecnología, la hipótesis más extendida apuntaba a DeepSeek V4, ya que Luo Fuli, jefe del equipo MiMo, había trabajado anteriormente en proyectos de investigación en DeepSeek. El número de llamadas a la API se disparó rápidamente, y el total de llamadas durante el periodo de anonimato superó el billón de tokens, lo que le valió el primer puesto en la clasificación semanal de OpenRouter.

En la madrugada del 19 de marzo, Xiaomi reveló: Hunter Alpha es, efectivamente, MiMo-V2-Pro. Según el mismo informe de Reuters, las acciones de Xiaomi en Hong Kong se dispararon un 5,8 % tras conocerse la noticia.

Es la primera vez que un modelo nacional a gran escala ha demostrado su eficacia en una plataforma mundial mediante pruebas ciegas. Sin depender de la marca ni de la publicidad, se tardó ocho días en que los desarrolladores votaran con los pies.

También te puede gustar

La IA empieza a revolucionar el sector manufacturero | Rewire News, edición matutina

Cuando Bezos empieza a utilizar la IA para comprar fábricas en lugar de construir centros de datos, queda claro que cree que el próximo gran potencial de la IA no reside en los centros de datos.

Cuando la escalabilidad se une a la velocidad, la Fundación Ethereum introduce la "dureza" para salvaguardar la capa base.

La robustez implica un compromiso a nivel de protocolo con las propiedades fundamentales de Ethereum, incluyendo la resistencia a la censura, la privacidad, la seguridad y la ausencia de permisos.

Google, Circle, Stripe se unen para permitir que la IA gaste dinero: Las alegrías y preocupaciones de los gigantes del pago en el primer trimestre de 2026

El verdadero enemigo ya no es el otro, sino el coste cero en sí mismo

Compra de fábrica por $100.000 millones: Bezos y el capital de Oriente Medio trasladan el dinero de la IA de la nube al suelo de la tienda

Bezos no invierte en un nuevo modelo; invierte en una cadena de suministro.

Los mercados de predicción han llamado la atención, pero el Perp DEX ha estado librando una guerra silenciosa contra los intercambios tradicionales.

Durante un fin de semana de volatilidad incesante, mientras los mercados financieros tradicionales estaban cerrados, otra ola de inversores estaba ocupada negociando oro, petróleo y plata en una plataforma de cadena de bloques.

¿Sigue generando millones al día la caída del mercado? ¿Son reales los ingresos de pump.fun?

Si realmente es tan rentable, ¿qué es lo que mantiene bajo el precio de $PUMP?

Monedas populares

Últimas noticias cripto

Más información