AI BENCHY Compare
xAI: Grok 4.3 vs Z.ai: GLM 5
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-01
| Métrica | Grok 4.3 Grok 4.3 medium | GLM 5 GLM 5 medium |
|---|---|---|
| Pontuação | 8.2 | 8.4 |
| Posição | #20 | #18 |
| Confiabilidade | 10.0 | N/D |
| Consistência | 8.6 | 8.2 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 81.5% | 85.2% |
| Testes instáveis | 3 | 4 |
| Execuções totais | 54 | 54 |
| Custo por resultado | 3.974 | 1.188 |
| Custo total | $0.517 | $0.155 |
| Preço de entrada | $1.250 / 1M | $0.600 / 1M |
| Preço de saída | $2.500 / 1M | $2.080 / 1M |
| Tokens de saída | 1,223 | 20,163 |
| Tokens de raciocínio | 187,047 | 58,337 |
| Tempo de resposta (médio) | 48.63s | 23.34s |
| Tempo de resposta (máx.) | 216.69s | 79.09s |
| Tempo de resposta (total) | 875.27s | 233.40s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
HY3 PreviewlowDisponível grátisvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumHY3 PreviewhighDisponível grátisvsGLM 5mediumHY3 PreviewlowDisponível grátisvsGLM 5mediumGemini 3 Flash PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGPT-5.2 ChatnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 PreviewhighDisponível grátisvsGrok 4.3mediumDeepSeek V4 FlashhighvsGrok 4.3medium