AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: GPT-5 Mini

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-17

Métrica	Mistral Small 4 Mistral Small 4 none Lanzamiento: 2026-03-16	GPT-5 Mini GPT-5 Mini medium Lanzamiento: 2025-08-07

Métrica	Mistral Small 4 Mistral Small 4 none Lanzamiento: 2026-03-16	GPT-5 Mini GPT-5 Mini medium Lanzamiento: 2025-08-07
Rango	#61	#38
Puntuación	5.3	6.8
Consistencia	9.5	8.5
Costo por resultado	0.108	1.473
Costo total	$0.006	$0.118
Pruebas correctas
Tasa de aciertos por intento	33.3%	58.8%
Pruebas inestables	1	3
Ejecuciones totales	51	51
Tokens de salida	1,624	5,896
Tokens de razonamiento	0	49,322
Tiempo de respuesta (promedio)	629ms	24.02s
Tiempo de respuesta (máximo)	1.72s	88.15s
Tiempo de respuesta (total)	10.70s	408.39s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	1,715	6,378

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	754	11,520

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	453	3,200

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	293	14,016

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	349	1,856

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
GPT-5 Mini	8.0	6.6	83.3%	1		15.66s	318	4,992

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
GPT-5 Mini	5.6	9.8	33.3%	0		14.09s	1,527	5,760

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	487	1,600

Comparación rápida

Cambiar par de comparación

GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5 MinimediumvsGLM 5none Claude Sonnet 4.6nonevsGPT-5 Minimedium Mistral Small 4nonevsQwen3 Coder Nextmedium DeepSeek V3.2nonevsGPT-5 Minimedium Mistral Small 4nonevsGLM 4.7 Flashmedium MiniMax M2.5mediumDisponible gratisvsMistral Small 4none Mistral Small 4nonevsgpt-oss-120bmediumDisponible gratis Mistral Small 4nonevsQwen3.5-9Bmedium GPT-5 MinimediumvsQwen3.5-Flashnone Seed-2.0-LitenonevsGPT-5 Minimedium Gemini 2.5 FlashnonevsGPT-5 Minimedium