AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Mistral: Mistral Small 4

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lanzamiento: 2026-05-10	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lanzamiento: 2026-05-10	Mistral Small 4 Mistral Small 4 medium Lanzamiento: 2026-03-16
Puntuación	7.2	5.4
Rango	#61	#121
Fiabilidad	9.9	10.0
Consistencia	8.7	7.1
Pruebas correctas
Tasa de aciertos por intento	66.7%	45.0%
Pruebas inestables	3	7
Ejecuciones totales	60	60
Costo por resultado	0.000	1.109
Costo total	$0.000	$0.056
Precio de entrada	$0.075 / 1M	$0.150 / 1M
Precio de salida	$0.625 / 1M	$0.600 / 1M
Tokens de salida	21,752	21,628
Tokens de razonamiento	42,754	68,055
Tiempo de respuesta (promedio)	61.29s	8.33s
Tiempo de respuesta (máximo)	304.19s	59.15s
Tiempo de respuesta (total)	1164.50s	166.59s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	4,055	4,778

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985
Mistral Small 4	5.1	6.8	33.3%	1		44.82s	9,322	38,386

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	2,612	10,700

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	335	723

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	2,621	6,904

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	821	828

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	540	1,031

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479
Mistral Small 4	3.4	9.7	0.0%	0		2.00s	983	2,338

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	321	810

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	18	1,557

Comparación rápida

Cambiar par de comparación

Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsKimi K2.5none Ling-2.6-flashnonevsMistral Small 4medium Mistral Small 4mediumvsQwen3.6 Flashnone Ring-2.6-1TmediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighDisponible gratisvsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.3 Chatnone Mistral Small 4mediumvsMiMo-V2.5-Pronone DeepSeek V3.2nonevsMistral Small 4medium Mistral Small 4mediumvsGLM 5.1none