AI BENCHY Compare
xAI: Grok 4.20 vs Z.ai: GLM 5
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-02
| Métrica | Grok 4.20 Grok 4.20 medium | GLM 5 GLM 5 none |
|---|---|---|
| Puntuación | 7.1 | 6.7 |
| Rango | #40 | #48 |
| Consistencia | 8.2 | 10.0 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 66.7% | 52.9% |
| Pruebas inestables | 4 | 0 |
| Ejecuciones totales | 51 | 51 |
| Costo por resultado | 7.358 | 0.201 |
| Costo total | $0.663 | $0.019 |
| Precio de entrada | $2.000 / 1M | $0.720 / 1M |
| Precio de salida | $6.000 / 1M | $2.300 / 1M |
| Tokens de salida | 1,494 | 1,551 |
| Tokens de razonamiento | 97,078 | 0 |
| Tiempo de respuesta (promedio) | 9.50s | 3.77s |
| Tiempo de respuesta (máximo) | 29.87s | 11.07s |
| Tiempo de respuesta (total) | 161.54s | 37.66s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
GPT-5 MinimediumvsGLM 5noneClaude Sonnet 4.6nonevsGrok 4.20mediumNemotron 3 SupermediumDisponible gratisvsGLM 5noneGrok 4.1 FastmediumvsGLM 5noneHunter AlphamediumvsGLM 5noneQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumGPT-5.4 MinimediumvsGLM 5noneGemma 4 31BnonevsGrok 4.20mediumMercury 2mediumvsGLM 5noneGPT-5.3 ChatnonevsGrok 4.20mediumGPT-5 NanomediumvsGLM 5noneKimi K2.5mediumvsGLM 5none