AI BENCHY Compare
OpenAI: GPT-5.4 vs Z.ai: GLM 5
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-15
| Métrica | GPT-5.4 GPT-5.4 medium | GLM 5 GLM 5 medium |
|---|---|---|
| Posição | #9 | #13 |
| Pontuação | 8.5 | 8.2 |
| Consistência | 8.5 | 8.0 |
| Custo por resultado | 6.601 | 0.933 |
| Custo total | $0.793 | $0.103 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 83.3% | 83.3% |
| Testes instáveis | 3 | 4 |
| Execuções totais | 48 | 48 |
| Tokens de saída | 1,756 | 19,773 |
| Tokens de raciocínio | 46,642 | 36,459 |
| Tempo de resposta (médio) | 20.05s | 16.16s |
| Tempo de resposta (máx.) | 100.41s | 28.96s |
| Tempo de resposta (total) | 320.87s | 129.26s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
GPT-5.2 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGPT-5.3 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4medium