AI BENCHY Compare
OpenAI: GPT-5.4 vs Z.ai: GLM 5
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-15
| Metrică | GPT-5.4 GPT-5.4 medium | GLM 5 GLM 5 medium |
|---|---|---|
| Rang | #9 | #13 |
| Scor | 8.5 | 8.2 |
| Consistență | 8.5 | 8.0 |
| Cost per rezultat | 6.601 | 0.933 |
| Cost total | $0.793 | $0.103 |
| Teste corecte | ||
| Rată de trecere pe încercare | 83.3% | 83.3% |
| Teste instabile | 3 | 4 |
| Rulări totale | 48 | 48 |
| Tokenuri de ieșire | 1,756 | 19,773 |
| Tokenuri de raționament | 46,642 | 36,459 |
| Timp de răspuns (mediu) | 20.05s | 16.16s |
| Timp de răspuns (maxim) | 100.41s | 28.96s |
| Timp de răspuns (total) | 320.87s | 129.26s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
GPT-5.2 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGPT-5.3 ChatnonevsGLM 5mediumGemini 3 Flash PreviewlowvsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGLM 5mediumGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4medium