Xiaomi et MiniMax déploient tous deux leurs dernières cartes, marquant ainsi le début de la guerre des prix entre les agents.
Les 18 et 19 mars, deux entreprises chinoises ont successivement dévoilé leurs grands modèles orientés agent. La start-up chinoise spécialisée dans l'IA MiniMax a lancé M2.7, tandis que l'équipe MiMo de Xiaomi, chargée des grands modèles, a présenté V2-Pro. Ces deux modèles se sont hissés parmi les meilleurs au classement mondial du benchmark Agent, mais le coût de sortie de leur API représente respectivement 1/21e et 1/8e de celui de Claude Opus 4.6.
Les deux entreprises ont joué leurs cartes la même semaine, mais avec des mains complètement différentes. Ils incarnent deux voies techniques totalement différentes, misant sur deux avenirs possibles de l'ère des agents.
Même examen, frais d'inscription du 17 janvier
Commençons par examiner la comparaison la plus intuitive.

D'après OpenRouter et diverses pages officielles de tarification des entreprises, sur la base du prix de sortie de l'API (par million de jetons), le MiniMax M2.7 coûte 1,2 $ et le MiMo-V2-Pro 3 $. À titre indicatif, le prix de vente de Claude Opus 4.6 est de 25 $, celui de GPT-5.2 de 14 $ et celui de Claude Sonnet 4.6 de 15 $.
La différence de prix est considérable, mais ce n'est pas le cas de la différence de performances. Dans le test SWE-bench Verified (la référence actuelle pour évaluer les capacités d'ingénierie du code), MiMo-V2-Pro a obtenu un score de 78 %, tandis que Sonnet 4.6 a atteint 79,6 %, soit un écart de moins de deux points de pourcentage. Le score SWE-Pro de M2.7 est de 56,22 %, ce qui le place au même niveau que GPT-5.3-Codex. Dans le cadre de VIBE-Pro (capacité de gestion de projet de bout en bout), M2.7 a obtenu un score de 55,6 %, se rapprochant ainsi du niveau d'Opus 4.6.
Ce graphique ne vise pas à déterminer qui se situe au-dessus ou en dessous : les systèmes de référence des différentes entreprises n'étant pas tout à fait harmonisés, il convient de faire preuve de prudence lors de comparaisons directes. L'accent est mis sur le « fossé entre le rapport qualité-prix » : les modèles Agent nationaux se situent dans la même fourchette de performances, mais dans des gammes de prix totalement différentes.
Des milliards de paramètres contre Évolution personnelle
Le prix n'est qu'une apparence. Les deux entreprises ont présenté deux atouts totalement différents.
Le MiMo-V2-Pro mise tout sur la puissance. Selon l'annonce officielle de Xiaomi, le V2-Pro compte plus d'un billion de paramètres au total, 42 milliards de paramètres d'activation et prend en charge un contexte ultra-long de 1 million de tokens. Sa principale innovation réside dans le mécanisme d'attention mixte « Hybrid Attention », qui ajuste le rapport entre l'attention par fenêtre glissante (SWA) et l'attention globale (GA) à 7:1 — contre 5:1 pour son prédécesseur, V2-Flash. Cette architecture rend le modèle plus stable dans les cas où des documents volumineux sont traités et où plusieurs appels parallèles d'outils sont effectués dans l'environnement de l'Agent. Dans PinchBench (évaluation des capacités d'appel des outils d'agent), MiMo-V2-Pro a obtenu un score de 84 %.
M2.7 a suivi une voie complètement différente. Selon un article publié le 18 mars sur le blog technique officiel de MiniMax, le nombre de paramètres du modèle M2.7 n'a pas été divulgué, mais celui-ci a démontré un mécanisme d'« évolution auto-itérative » : le modèle a exécuté de manière autonome plus de 100 boucles d'optimisation, comprenant l'analyse des trajectoires d'échec, la planification de modifications, la modification de sa propre architecture de code, la réalisation d'évaluations, puis la répétition du cycle, pour finalement atteindre une amélioration de 30 % des performances sur un ensemble d'évaluation interne. Lors du concours MLE Bench Lite (Machine Learning Contest Difficulty Assessment), sur les 22 problèmes complexes proposés, M2.7 a remporté 9 médailles d'or, 5 d'argent et 1 de bronze, avec un taux moyen de médailles de 66,6 %.

Sur cinq dimensions, les deux voies s'orientent dans des directions totalement différentes : MiMo-V2-Pro domine clairement en termes de longueur de contexte et d'ingénierie du code, tandis que M2.7 creuse l'écart dans les domaines de la bureautique et de la capacité d'auto-itération. Selon le même article publié sur le blog technique de MiniMax, M2.7 a obtenu un score ELO de 1 495 au test GDPval-AA (évaluation du traitement de documents bureautiques), se classant ainsi en tête des modèles open source, et a maintenu un taux de conformité de 97 % lors du test MM-Claw, qui porte sur plus de 40 compétences complexes.
Quatre versions en cinq mois
Non seulement les orientations techniques des deux entreprises divergent, mais leurs cadences de développement sont également totalement différentes.
D'après les archives publiques, entre la sortie de la version M2 en octobre 2025 et celle de la version M2.7 en mars 2026, MiniMax a publié quatre versions en l'espace de cinq mois, soit une version majeure tous les 49 jours en moyenne. L'écart entre M2.5 et M2.7 n'était que d'environ 30 jours.
Le rythme du MiMo de Xiaomi est différent : MiMo-7B a été lancé en avril 2025 (un modèle d'inférence open source comptant 7 milliards de paramètres), V2-Flash a été lancé en décembre de la même année (avec un total de 309 milliards de paramètres), et V2-Pro a été lancé en mars 2026 (avec un total de 1 000 milliards de paramètres). L'échelle des paramètres entre chaque génération est bien plus grande, mais les intervalles entre les versions sont également plus longs.
MiniMax a opté pour des étapes courtes et fréquentes, chaque itération ne faisant pas de grands bonds en avant, mais se déroulant à un rythme très soutenu. Le mécanisme d'auto-itération de M2.7 est lui-même conçu pour une « évolution continue ». Xiaomi a opté pour une approche plus audacieuse, chaque version présentant des changements notables au niveau des caractéristiques techniques et de l'architecture.

Anonyme 8 jours, Sommet OpenRouter
Outre sa feuille de route technique, la stratégie de lancement de Xiaomi a également bouleversé les conventions du secteur.
Selon Reuters, le 11 mars, un modèle anonyme du nom de Hunter Alpha a fait son apparition sur OpenRouter, la plus grande plateforme d'agrégation d'API au monde. Pas de promotion de marque, pas de lancement de produit, pas de blog technique. Le prix de son API était extrêmement bas, mais ses performances étaient étonnamment élevées.
La communauté a commencé à s'interroger sur ses origines. Selon Republic World et plusieurs médias spécialisés dans les technologies, l'hypothèse la plus courante était celle d'un DeepSeek V4, car Luo Fuli, chef de l'équipe MiMo, avait auparavant mené des travaux de recherche chez DeepSeek. Le nombre d'appels API a rapidement explosé, le nombre total d'appels effectués pendant la période d'anonymat dépassant le billion de tokens, ce qui a permis à la plateforme d'atteindre la première place du classement hebdomadaire d'OpenRouter.

Tôt dans la matinée du 19 mars, Xiaomi a annoncé : Hunter Alpha est en effet un MiMo-V2-Pro. Selon ce même article de Reuters, l'action de Xiaomi cotée à Hong Kong a bondi de 5,8 % à la suite de cette annonce.
C'est la première fois qu'un modèle national à grande échelle fait ses preuves sur une plateforme mondiale à l'issue d'un test à l'aveugle. Sans miser sur la marque ni sur la publicité, il a fallu huit jours pour que les développeurs se prononcent par leurs actes.
Vous pourriez aussi aimer

Connecter le chiffrement, TradFi et les paiements, Gate est-il en train de compléter le puzzle final de la "super APP"?

Partenaire opérationnel de a16z Crypto : Wall Street subit sa plus grande mise à niveau d'infrastructure depuis 30 ans

Dernières recherches d'a16z Crypto : Quel est le facteur clé de l'application à grande échelle de la DeFi ?

Fondateur de Delphi Labs : Mes observations et sentiments sur l'écosystème de l'IA en Chine en deux semaines

Diffusion du plan de table de l’IA | Rewire News Morning Brief

L'ère du « moment GPT » de l'IA incarnée approche-t-elle ? Axis Robotics annonce la fin des tests et le lancement sur Base Chain est prévu.

Méta mise à pied expliquée : Le même jour qu’ils ont licencié 700 personnes, ils ont distribué 90 milliards de dollars de bonus de fidélisation aux dirigeants

Le Bénin réprime les makers de marché, un procès attendu depuis longtemps

Collectif de Wall Street baissier en 2026, la crise pétrolière déclenchera-t-elle une récession ?

La nécromancie de l'IA à Hollywood : La mort n'est plus la fin du travail

a16z : La DeFi peine à soutenir un véritable marché financier

Infos du matin | Bitmine lance sa plateforme institutionnelle de staking Ethereum MAVAN ; Franklin Templeton lance un ETF tokenisé ; Morgan Stanley va émettre et sponsoriser un ETF Bitcoin

Premiers employés de Kalshi : Celui qui contrôle le trafic contrôle le marché

Fier de vous présenter Aethir Claw : Votre agent IA, notre infrastructure

Pourquoi acheter de l'or peut mener à la faillite

Si le rendement du Trésor américain dépasse 5 %, le Bitcoin tombera-t-il en dessous de 50 000 $ ?

Circle s'effondre de 20 % : Un séisme sur le marché des cryptomonnaies provoqué par un projet de proposition

