AI BENCHY Compare

Google: Gemini 3.5 Flash vs Mistral: Mistral Small 4

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash low Lanzamiento: 2026-05-19	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16

Métrica	Gemini 3.5 Flash Gemini 3.5 Flash low Lanzamiento: 2026-05-19	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16
Puntuación	9.3	5.4
Rango	#3	#126
Fiabilidad	10.0	10.0
Consistencia	10.0	7.1
Pruebas correctas
Tasa de aciertos por intento	90.0%	45.0%
Pruebas inestables	0	7
Ejecuciones totales	60	60
Costo por resultado	1.582	1.112
Costo total	$0.285	$0.056
Precio de entrada	$1.500 / 1M	$0.150 / 1M
Precio de salida	$9.000 / 1M	$0.600 / 1M
Tokens de salida	2,027	21,871
Tokens de razonamiento	23,938	68,349
Tiempo de respuesta (promedio)	2.98s	8.35s
Tiempo de respuesta (máximo)	6.44s	59.15s
Tiempo de respuesta (total)	59.59s	167.08s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	209	2,536
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	6.8	10.0	50.0%	0		5.54s	452	6,839
Mistral Small 4	5.1	6.8	33.3%	1		44.82s	9,322	38,386

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	351	3,050
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	279	1,164
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	12	4,538
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	119	916
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	71	1,652
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	288	2,150
Mistral Small 4	3.4	9.7	0.0%	0		2.17s	1,226	2,632

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	234	403
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	12	690
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	18	1,557

Comparación rápida

Cambiar par de comparación

Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsgpt-oss-120bnoneDisponible gratis Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsKimi K2.5none Ling-2.6-flashnonevsMistral Small 4medium Mistral Small 4mediumvsQwen3.6 Flashnone Mistral Small 4mediumvsElephant Alphanone Mistral Small 4mediumvsMiMo-V2.5-Pronone Mistral Small 4mediumvsGPT-5.4none Mistral Small 4mediumvsKimi K2.6noneDisponible gratis Mistral Small 4mediumvsGLM 4.7 Flashnone