Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible
By: decrypt|2025/05/11 04:30:12
0
Compartir
Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible Mistral Medium 3 ofrece un rendimiento de gama alta, es lo suficientemente económico para abrirse camino en el software empresarial y supera a los principales competidores. En Resumen Mistral lanzó Medium 3 con rendimiento empresarial y costos ocho veces menores que modelos similares. Evaluaciones lo posicionaron por encima de Llama 4 Maverick y a la par de Claude Sonnet 3.7 en tareas profesionales. Aunque cerrado, Medium 3 ya se usa en sectores clave y llegará a más plataformas como IBM WatsonX y Google Cloud. Decrypt’s Art, Fashion, and Entertainment Hub. Mistral Medium 3 se lanzó ayer, posicionándose como un desafío directo a la economía del despliegue de IA empresarial. La startup parisina, fundada en 2023 por antiguos investigadores de Google DeepMind y Meta AI, lanzó lo que afirma ofrece un rendimiento de vanguardia a un octavo del costo operativo de modelos comparables. "Mistral Medium 3 ofrece un rendimiento de vanguardia, siendo [...] menos costoso", dijo la compañía. El modelo representa la oferta propietaria más potente de Mistral AI hasta la fecha, distinguiéndose de un portafolio de código abierto que incluye Mistral 7B, Mixtral, Codestral y Pixtral. Con $0,4 por millones de tokens de entrada y $2 por millón de tokens de salida, Medium 3 reduce significativamente los costos frente a sus competidores mientras mantiene la paridad de rendimiento. Evaluaciones independientes de Artificial Analysis posicionaron al modelo "entre los principales modelos sin razonamiento, rivalizando Medium 3 con Llama 4 Maverick, Gemini 2.0 Flash y Claude 3.7 Sonnet". Mistral Medium 3 independent evals: Mistral is back amongst the leading non-reasoning models with Medium 3 rivalling Llama 4 Maverick, Gemini 2.0 Flash and Claude 3.7 Sonnet Key takeaways: ➤ Intelligence: We see substantial intelligence gains across all 7 of our evals compared... pic.twitter.com/mc9il9WV8J — Artificial Analysis (@ArtificialAnlys) May 8, 2025 El modelo destaca particularmente en dominios profesionales. Evaluaciones humanas demostraron un rendimiento superior en tareas de codificación, con Sophia Yang, representante de Mistral AI, señalando que "Mistral Medium 3 brilla en el dominio de la codificación y ofrece un rendimiento mucho mejor, en general, que algunos de sus competidores mucho más grandes". Los resultados de las pruebas indican que Medium 3 se desempeña igual o por encima de Claude Sonnet 3.7 de Anthropic en diversas categorías de prueba, mientras supera sustancialmente a Llama 4 Maverick de Meta y Command A de Cohere en áreas especializadas como codificación y razonamiento. La ventana de contexto de 128.000 tokens del modelo es estándar, y su multimodalidad le permite procesar documentos y entradas visuales en 40 idiomas. Pero a diferencia de los modelos que hicieron famoso a Mistral, los usuarios no podrán modificarlo ni ejecutarlo localmente. Actualmente, la mejor fuente para entusiastas del código abierto es Mixtral-8x22B-v0.3 , un modelo de mezcla de expertos que ejecuta 8 expertos de 22.000 millones de parámetros cada uno. Además de Mixtral, la compañía tiene más de una docena de diferentes modelos de código abierto disponibles. También está inicialmente disponible para despliegue empresarial y no para uso doméstico a través de LeChat, la interfaz de chatbot de Mistral. Mistral AI enfatizó las capacidades de adaptación empresarial del modelo, que admite preentrenamiento continuo, ajuste completo e integración en bases de conocimiento corporativas para aplicaciones específicas de dominio. Clientes beta de los sectores de servicios financieros, energía y salud están probando el modelo para mejorar el servicio al cliente, personalizar procesos comerciales y analizar conjuntos de datos complejos. La API se lanzará inmediatamente en Mistral La Plateforme y Amazon Sagemaker, con una próxima integración planificada para IBM WatsonX, NVIDIA NIM, Azure AI Foundry y Google Cloud Vertex. El anuncio generó un considerable debate en las plataformas de redes sociales, con investigadores de IA elogiando el avance en eficiencia de costos mientras señalaban la naturaleza propietaria como una posible limitación. El estado de código cerrado del modelo marca una desviación de las ofertas de peso abierto de Mistral, aunque la compañía insinuó futuros lanzamientos. "Con los lanzamientos de Mistral Small en marzo y Mistral Medium hoy, no es un secreto que estamos trabajando en algo 'grande' durante las próximas semanas", insinuó Sophia Yang, Jefa de Relaciones con Desarrolladores de Mistral, en el anuncio. "Con incluso nuestro modelo de tamaño medio siendo rotundamente mejor que los modelos de código abierto emblemáticos como Llama 4 Maverick, estamos emocionados por 'abrir' lo que está por venir". Mistral tiende a alucinar menos que el modelo promedio, lo cual es una excelente noticia considerando su tamaño. Es mejor que Meta Llama-4 Maverick, Deepseek V3 y Amazon Nova Pro, por nombrar algunos. En este momento, el modelo que tiene menos alucinaciones es el recientemente lanzado Gemini 2.5 Pro de Google. Este lanzamiento llega en medio de un impresionante crecimiento comercial para la compañía parisina, a pesar de haber estado en silencio desde el lanzamiento de Mistral Large 2 el año pasado. Mistral lanzó recientemente una versión empresarial de su chatbot Le Chat que se integra con Microsoft SharePoint y Google Drive, con el CEO Arthur Mensch diciendo a Reuters que han "triplicado (su) negocio en los últimos 100 días, en particular en Europa y fuera de EE.UU." La compañía, ahora valorada en $6.000 millones, está flexionando su independencia tecnológica operando su propia infraestructura de cómputo y reduciendo la dependencia de proveedores de nube estadounidenses—un movimiento estratégico que resuena en Europa en medio de relaciones tensas tras los aranceles del Presidente Trump sobre productos tecnológicos. Queda por ver si la afirmación de Mistral de lograr un rendimiento de nivel empresarial a precios accesibles para el consumidor se mantiene en el despliegue del mundo real. Pero por ahora, Mistral ha posicionado Medium 3 como un punto medio convincente en una industria que a menudo asume que más grande (y más caro) equivale a mejor. Editado por Josh Quittner y Sebastian Sinclair Generally Intelligent Newsletter
También te puede interesar

¿WLFI de nuevo? Controversia sobre la licencia bancaria en medio de una inversión de $500 millones
La inversión de los EAU en World Liberty Financial ha aumentado las preocupaciones sobre si recibió un trato especial y si hay problemas de seguridad nacional involucrados

El conflicto entre Estados Unidos e Irán se extiende al espacio criptográfico: Qué esperar del mercado el lunes
La industria más importante del mundo criptográfico, a solo 300 kilómetros del punto de impacto del misil.

El proyecto Titan inaugural del Protocolo Virtuals: ROBO tiene como objetivo dar una billetera a un robot
Este es un paso clave en la expansión de Virtuals en la Economía de Agentes en el campo de la IA Embodida y la Robótica.

Stablecoin Último informe: Distribución y circulación reales mucho más notables que el suministro
La verdad sobre la velocidad de circulación, la concentración y la estructura de las stablecoins después de duplicar el suministro

¿Por qué parar en 126K? Michael Saylor analiza el estancamiento de BTC y la ausencia minorista
Bitcoin es capital digital, y pasaré mil horas explicándotelo. Evento, lo entenderás, pero aún tendrás que soportar un choque del 45%.

Fundador de Wintermute: En el mercado perdido de las criptomonedas, ¿qué podemos hacer aún?
Esto es más bien un manifiesto, en el que se analiza «la verdadera razón por la que estamos aquí».

Deuda de $1.300 millones: BitDeer enfrenta una dura batalla
Wu Jihan está esperando el dinero de IA para ponerse al día con la velocidad de la deuda.

La apuesta de Anthropic por salir a bolsa: En el momento más inesperado, decidió decir que no.
En la era de la IA, ¿qué es lo más valioso?

Problema matemático de paradigma: $12.700 millones, demasiado grandes para un solo fondo cripto
Surgiendo de las ruinas de FTX, Paradigma tardó tres años

Ethereum presenta la hoja de ruta a escala, ¿qué es diferente esta vez?
Mejoras en short plazo de la eficiencia de ejecución a través de la optimización del mecanismo de gas y la paralelización de la validación de bloques, y escalabilidad en long plazo a través de ZK-EVM y arquitectura de datos blobs.

Ola de prohibición antrópica, controversia de fondos OpenAI de $100.000 millones: ¿De qué habla hoy la comunidad cripto en el extranjero?
¿Qué es lo que más interés han mostrado los extranjeros en las últimas 24 horas?

La reducción del 40% de la fuerza laboral de Block debido a la 'reducción de costos de IA', Anthropic niega la solicitud del Departamento de Defensa de EE. UU., ¿De qué están hablando hoy las comunidades globales de criptomonedas?
¿Qué ha sido lo más importante para los expatriados en las últimas 24 horas?

¿Por qué Wall Street está **vendiendo en corto** la estrategia **estrella** de las criptomonedas?
La mediana del interés corto para los componentes del índice S&P 500 ha aumentado hasta el 2,7 %, siendo Strategy el que tiene el mayor interés corto como porcentaje de la capitalización bursátil, con un 14 % entre todos los componentes.

Más allá de las finanzas, el verdadero riesgo y oportunidad de Nvidia
Si el mercado puede seguir confiando en que NVIDIA alcance una alta tasa de crecimiento anual del compuesto de ingresos de un dígito (CAGR) después del año fiscal 2027, el punto medio de valoración podría recibir apoyo

Citrini Eco persistente
Doomscrolling, la ansiedad paga la cuenta

Wintermute: La volatilidad de las criptomonedas se desploma mientras los inversores minoristas se lanzan en masa a comprar acciones estadounidenses.
Los inversores minoristas están acudiendo en masa al mercado de valores a un ritmo récord, lo que ha provocado que la relación entre el mercado de las criptomonedas y el mercado de valores pase de ser «correlacionada» a «alternativa».

Bloomberg: Las elecciones presidenciales de Rumania fueron manipuladas por comerciantes de criptomonedas
El rompecabezas electoral rumano bajo manipulación digital.
Programa de referidos para comerciantes WEEX P2P | ¡Invita y gana hasta 100 USDT cada uno!
WEEX P2P está lanzando el "Programa de Referidos para Comerciantes" para construir una comunidad de comerciantes P2P más fuerte y aumentar la liquidez del mercado. Refiere a comerciantes potenciales para unirse a WEEX P2P y ambos pueden ganar recompensas.
¿WLFI de nuevo? Controversia sobre la licencia bancaria en medio de una inversión de $500 millones
La inversión de los EAU en World Liberty Financial ha aumentado las preocupaciones sobre si recibió un trato especial y si hay problemas de seguridad nacional involucrados
El conflicto entre Estados Unidos e Irán se extiende al espacio criptográfico: Qué esperar del mercado el lunes
La industria más importante del mundo criptográfico, a solo 300 kilómetros del punto de impacto del misil.
El proyecto Titan inaugural del Protocolo Virtuals: ROBO tiene como objetivo dar una billetera a un robot
Este es un paso clave en la expansión de Virtuals en la Economía de Agentes en el campo de la IA Embodida y la Robótica.
Stablecoin Último informe: Distribución y circulación reales mucho más notables que el suministro
La verdad sobre la velocidad de circulación, la concentración y la estructura de las stablecoins después de duplicar el suministro
¿Por qué parar en 126K? Michael Saylor analiza el estancamiento de BTC y la ausencia minorista
Bitcoin es capital digital, y pasaré mil horas explicándotelo. Evento, lo entenderás, pero aún tendrás que soportar un choque del 45%.
Fundador de Wintermute: En el mercado perdido de las criptomonedas, ¿qué podemos hacer aún?
Esto es más bien un manifiesto, en el que se analiza «la verdadera razón por la que estamos aquí».