AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-24
| Métrique | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| Score | 8.2 | 9.0 |
| Rang | #18 | #5 |
| Fiabilité | N/D | N/D |
| Cohérence | 8.7 | 9.2 |
| Tests corrects | ||
| Taux de réussite par tentative | 79.6% | 87.0% |
| Tests instables | 3 | 2 |
| Exécutions totales | 54 | 54 |
| Coût par résultat | 6.399 | 19.226 |
| Coût total | $0.832 | $2.884 |
| Prix d'entrée | $2.500 / 1M | $5.000 / 1M |
| Prix de sortie | $15.000 / 1M | $30.000 / 1M |
| Jetons de sortie | 2,169 | 1,920 |
| Jetons de raisonnement | 48,732 | 89,632 |
| Temps de réponse (moy.) | 18.63s | 32.75s |
| Temps de réponse (max) | 100.41s | 332.10s |
| Temps de réponse (total) | 335.26s | 589.59s |
Score vs coût total
Temps de réponse (moy.)
Score vs Temps de réponse (moy.)
Total des jetons de sortie
Score vs Total des jetons de sortie
Répartition par catégorie
Comparaison rapide
Changer la paire de comparaison
GPT-5.4mediumvsHY3 PreviewlowDisponible gratuitementGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 PreviewhighDisponible gratuitementGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewhighDisponible gratuitementGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewlowDisponible gratuitement