Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible

By: decrypt|2025/05/11 04:30:12

Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible Mistral Medium 3 ofrece un rendimiento de gama alta, es lo suficientemente económico para abrirse camino en el software empresarial y supera a los principales competidores. En Resumen Mistral lanzó Medium 3 con rendimiento empresarial y costos ocho veces menores que modelos similares. Evaluaciones lo posicionaron por encima de Llama 4 Maverick y a la par de Claude Sonnet 3.7 en tareas profesionales. Aunque cerrado, Medium 3 ya se usa en sectores clave y llegará a más plataformas como IBM WatsonX y Google Cloud. Decrypt’s Art, Fashion, and Entertainment Hub. Mistral Medium 3 se lanzó ayer, posicionándose como un desafío directo a la economía del despliegue de IA empresarial. La startup parisina, fundada en 2023 por antiguos investigadores de Google DeepMind y Meta AI, lanzó lo que afirma ofrece un rendimiento de vanguardia a un octavo del costo operativo de modelos comparables. "Mistral Medium 3 ofrece un rendimiento de vanguardia, siendo [...] menos costoso", dijo la compañía. El modelo representa la oferta propietaria más potente de Mistral AI hasta la fecha, distinguiéndose de un portafolio de código abierto que incluye Mistral 7B, Mixtral, Codestral y Pixtral. Con $0,4 por millones de tokens de entrada y $2 por millón de tokens de salida, Medium 3 reduce significativamente los costos frente a sus competidores mientras mantiene la paridad de rendimiento. Evaluaciones independientes de Artificial Analysis posicionaron al modelo "entre los principales modelos sin razonamiento, rivalizando Medium 3 con Llama 4 Maverick, Gemini 2.0 Flash y Claude 3.7 Sonnet". Mistral Medium 3 independent evals: Mistral is back amongst the leading non-reasoning models with Medium 3 rivalling Llama 4 Maverick, Gemini 2.0 Flash and Claude 3.7 Sonnet Key takeaways: ➤ Intelligence: We see substantial intelligence gains across all 7 of our evals compared... pic.twitter.com/mc9il9WV8J — Artificial Analysis (@ArtificialAnlys) May 8, 2025 El modelo destaca particularmente en dominios profesionales. Evaluaciones humanas demostraron un rendimiento superior en tareas de codificación, con Sophia Yang, representante de Mistral AI, señalando que "Mistral Medium 3 brilla en el dominio de la codificación y ofrece un rendimiento mucho mejor, en general, que algunos de sus competidores mucho más grandes". Los resultados de las pruebas indican que Medium 3 se desempeña igual o por encima de Claude Sonnet 3.7 de Anthropic en diversas categorías de prueba, mientras supera sustancialmente a Llama 4 Maverick de Meta y Command A de Cohere en áreas especializadas como codificación y razonamiento. La ventana de contexto de 128.000 tokens del modelo es estándar, y su multimodalidad le permite procesar documentos y entradas visuales en 40 idiomas. Pero a diferencia de los modelos que hicieron famoso a Mistral, los usuarios no podrán modificarlo ni ejecutarlo localmente. Actualmente, la mejor fuente para entusiastas del código abierto es Mixtral-8x22B-v0.3 , un modelo de mezcla de expertos que ejecuta 8 expertos de 22.000 millones de parámetros cada uno. Además de Mixtral, la compañía tiene más de una docena de diferentes modelos de código abierto disponibles. También está inicialmente disponible para despliegue empresarial y no para uso doméstico a través de LeChat, la interfaz de chatbot de Mistral. Mistral AI enfatizó las capacidades de adaptación empresarial del modelo, que admite preentrenamiento continuo, ajuste completo e integración en bases de conocimiento corporativas para aplicaciones específicas de dominio. Clientes beta de los sectores de servicios financieros, energía y salud están probando el modelo para mejorar el servicio al cliente, personalizar procesos comerciales y analizar conjuntos de datos complejos. La API se lanzará inmediatamente en Mistral La Plateforme y Amazon Sagemaker, con una próxima integración planificada para IBM WatsonX, NVIDIA NIM, Azure AI Foundry y Google Cloud Vertex. El anuncio generó un considerable debate en las plataformas de redes sociales, con investigadores de IA elogiando el avance en eficiencia de costos mientras señalaban la naturaleza propietaria como una posible limitación. El estado de código cerrado del modelo marca una desviación de las ofertas de peso abierto de Mistral, aunque la compañía insinuó futuros lanzamientos. "Con los lanzamientos de Mistral Small en marzo y Mistral Medium hoy, no es un secreto que estamos trabajando en algo 'grande' durante las próximas semanas", insinuó Sophia Yang, Jefa de Relaciones con Desarrolladores de Mistral, en el anuncio. "Con incluso nuestro modelo de tamaño medio siendo rotundamente mejor que los modelos de código abierto emblemáticos como Llama 4 Maverick, estamos emocionados por 'abrir' lo que está por venir". Mistral tiende a alucinar menos que el modelo promedio, lo cual es una excelente noticia considerando su tamaño. Es mejor que Meta Llama-4 Maverick, Deepseek V3 y Amazon Nova Pro, por nombrar algunos. En este momento, el modelo que tiene menos alucinaciones es el recientemente lanzado Gemini 2.5 Pro de Google. Este lanzamiento llega en medio de un impresionante crecimiento comercial para la compañía parisina, a pesar de haber estado en silencio desde el lanzamiento de Mistral Large 2 el año pasado. Mistral lanzó recientemente una versión empresarial de su chatbot Le Chat que se integra con Microsoft SharePoint y Google Drive, con el CEO Arthur Mensch diciendo a Reuters que han "triplicado (su) negocio en los últimos 100 días, en particular en Europa y fuera de EE.UU." La compañía, ahora valorada en $6.000 millones, está flexionando su independencia tecnológica operando su propia infraestructura de cómputo y reduciendo la dependencia de proveedores de nube estadounidenses—un movimiento estratégico que resuena en Europa en medio de relaciones tensas tras los aranceles del Presidente Trump sobre productos tecnológicos. Queda por ver si la afirmación de Mistral de lograr un rendimiento de nivel empresarial a precios accesibles para el consumidor se mantiene en el despliegue del mundo real. Pero por ahora, Mistral ha posicionado Medium 3 como un punto medio convincente en una industria que a menudo asume que más grande (y más caro) equivale a mejor. Editado por Josh Quittner y Sebastian Sinclair Generally Intelligent Newsletter

También te puede interesar

Reporte matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en $135 por acción

Resumen de eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Reporte matutino | Strategy vendió 32 BTC y más de 800,000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: Cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología del trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina supremo: Cómo el PSG aplastó el sueño del Arsenal en una final histórica de la UCL

PSG vs Arsenal, drama, destino y una maldición de 20 años hecha añicos. Revive la final de la UCL 2026 donde el PSG defendió su corona en una tensa tanda de penales, mientras el momento dorado de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiamiento estratégico de $3.5 millones, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

TaiJi, la plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, anunció la culminación de una ronda de financiamiento estratégico de $3.5 millones, la cual acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los $73K? Cómo los traders encuentran recompensas en un mercado lateral de junio

Bitcoin está estancado cerca de los $73K a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como WEEX Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA de 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y una guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado la función de "Precio garantizado".

La investigación más reciente del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, las respuestas regulatorias y la sinergia de...

Entrevista con el experto en macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa fallida de los guardianes de Solana: para destrozar a Hyperliquid, ¿realmente retomaron el guion que alguna vez criticó a Ethereum?

El auge de HYPE desata una batalla de gigantes. El líder de Solana critica airadamente a Hyperliquid por ser demasiado centralizado, mientras que Arthur Hayes responde con una réplica contundente, apostando 100 000 USD.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara una salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Reporte matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en $135 por acción

Resumen de eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.