AI BENCHY Compare
OpenAI: GPT-5.4 vs Z.ai: GLM 5
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-15
| Métrica | GPT-5.4 GPT-5.4 medium | GLM 5 GLM 5 medium |
|---|---|---|
| Rango | #9 | #13 |
| Puntuación | 8.5 | 8.2 |
| Consistencia | 8.5 | 8.0 |
| Costo por resultado | 6.601 | 0.933 |
| Costo total | $0.793 | $0.103 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 83.3% | 83.3% |
| Pruebas inestables | 3 | 4 |
| Ejecuciones totales | 48 | 48 |
| Tokens de salida | 1,756 | 19,773 |
| Tokens de razonamiento | 46,642 | 36,459 |
| Tiempo de respuesta (promedio) | 20.05s | 16.16s |
| Tiempo de respuesta (máximo) | 100.41s | 28.96s |
| Tiempo de respuesta (total) | 320.87s | 129.26s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
GPT-5.2 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGPT-5.3 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4medium