AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-24
| Metrică | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| Scor | 8.2 | 9.0 |
| Rang | #18 | #5 |
| Fiabilitate | N/D | N/D |
| Consistență | 8.7 | 9.2 |
| Teste corecte | ||
| Rată de trecere pe încercare | 79.6% | 87.0% |
| Teste instabile | 3 | 2 |
| Rulări totale | 54 | 54 |
| Cost per rezultat | 6.399 | 19.226 |
| Cost total | $0.832 | $2.884 |
| Preț de intrare | $2.500 / 1M | $5.000 / 1M |
| Preț de ieșire | $15.000 / 1M | $30.000 / 1M |
| Tokenuri de ieșire | 2,169 | 1,920 |
| Tokenuri de raționament | 48,732 | 89,632 |
| Timp de răspuns (mediu) | 18.63s | 32.75s |
| Timp de răspuns (maxim) | 100.41s | 332.10s |
| Timp de răspuns (total) | 335.26s | 589.59s |
Scor vs cost total
Timp de răspuns (mediu)
Scor vs Timp de răspuns (mediu)
Total tokenuri de ieșire
Scor vs Total tokenuri de ieșire
Defalcare pe categorii
Comparație rapidă
Schimbă perechea de comparație
GPT-5.4mediumvsHY3 PreviewlowDisponibil gratuitGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 PreviewhighDisponibil gratuitGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewhighDisponibil gratuitGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewlowDisponibil gratuit