AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs Mistral: Mistral Small 4

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-01

Métrica	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21	Mistral Small 4 Mistral Small 4 none Lanzamiento: 2026-03-16

Métrica	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21	Mistral Small 4 Mistral Small 4 none Lanzamiento: 2026-03-16
Puntuación	5.4	5.2
Rango	#107	#115
Fiabilidad	N/D	N/D
Consistencia	9.5	9.5
Pruebas correctas
Tasa de aciertos por intento	35.2%	31.5%
Pruebas inestables	1	1
Ejecuciones totales	52	54
Costo por resultado	0.000	0.118
Costo total	$0.000	$0.006
Precio de entrada	$0.080 / 1M	$0.150 / 1M
Precio de salida	$0.240 / 1M	$0.600 / 1M
Tokens de salida	3,338	2,207
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	11.33s	665ms
Tiempo de respuesta (máximo)	35.34s	1.72s
Tiempo de respuesta (total)	203.88s	11.97s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	6.5	10.0	50.0%	0		12.30s	1,064	0
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	3.0	10.0	0.0%	0		4.94s	20	0
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	4.1	10.0	0.0%	0		11.85s	106	0
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	2.9	7.2	11.1%	1		11.55s	142	0
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0

Comparación rápida

Cambiar par de comparación

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratis Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratis Ling-2.6-flashnonevsMiniMax M2.5mediumDisponible gratis Ling-2.6-flashnonevsMistral Small 4medium Mistral Small 4nonevsQwen3 Coder Nextmedium MiniMax M2.5mediumDisponible gratisvsMistral Small 4none Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium