AI BENCHY Compare

IBM: Granite 4.1 8B vs inclusionAI: Ling-2.6-flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-29

Métrica	Granite 4.1 8B Granite 4.1 8B none Lanzamiento: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21

Métrica	Granite 4.1 8B Granite 4.1 8B none Lanzamiento: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Lanzamiento: 2026-04-21
Puntuación	4.1	5.3
Rango	#158	#135
Fiabilidad	10.0	10.0
Consistencia	10.0	9.2
Pruebas correctas
Tasa de aciertos por intento	10.0%	35.1%
Pruebas inestables	0	2
Ejecuciones totales	60	60
Costo por resultado	0.122	0.005
Costo total	$0.003	$0.001
Precio de entrada	$0.050 / 1M	$0.010 / 1M
Precio de salida	$0.100 / 1M	$0.030 / 1M
Tokens de salida	2,743	2,878
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	719ms	9.34s
Tiempo de respuesta (máximo)	2.17s	35.34s
Tiempo de respuesta (total)	14.37s	177.48s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	5.2	10.0	0.0%	0		706ms	357	0
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	432	0
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	151	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	12	0
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0

Comparación rápida

Cambiar par de comparación

Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium Granite 4.1 8BnonevsQwen3.5-9Bmedium Ling-2.6-flashnonevsMiniMax M2.5mediumDisponible gratis Granite 4.1 8BnonevsGLM 4.7 Flashmedium CobuddymediumvsLing-2.6-flashnone Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsgpt-oss-120bmediumDisponible gratis Ling-2.6-flashnonevsNemotron 3 SupermediumDisponible gratis