Comparar Gráficos Metodología

Idioma:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-06

Métrica	Trinity Large Preview none Lanzamiento: 2026-01-27 Disponible gratis	Z.ai: GLM 4.7 Flash medium Lanzamiento: 2026-01-19
Rango	#45	#52
Puntaje prom.	4.2	3.1
Consistencia	9.6	6.4
Costo por resultado	0.000	1.040
Costo total	$0.000	$0.042
Pruebas correctas
Tasa de aciertos por intento	33.3%	41.7%
Pruebas inestables	1	7
Ejecuciones totales	48	48
Tokens de salida	1,837	38,682
Tokens de razonamiento	0	64,952
Tiempo de respuesta (promedio)	3.15s	36.84s
Tiempo de respuesta (máximo)	8.91s	174.55s
Tiempo de respuesta (total)	50.46s	331.58s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntaje prom. vs Tiempo de respuesta (promedio)

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Z.ai: GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Z.ai: GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Z.ai: GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Z.ai: GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Z.ai: GLM 4.7 Flash	10.0	9.7	0.0%	0		18.14s	18	2,138

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Z.ai: GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Z.ai: GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Z.ai: GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Comparación rápida

Cambiar par de comparación

Grok 4.1 FastnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponible gratisvsMiniMax M2.5medium LFM2-24B-A2BnonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponible gratisvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponible gratisvsgpt-oss-120bmediumDisponible gratis Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponible gratisvsMercury 2medium Trinity Large PreviewnoneDisponible gratisvsQwen3.5-35B-A3Bmedium