AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-24
| Métrica | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| Pontuação | 8.2 | 9.0 |
| Posição | #18 | #5 |
| Confiabilidade | N/D | N/D |
| Consistência | 8.7 | 9.2 |
| Testes corretos | ||
| Taxa de acerto por tentativa | 79.6% | 87.0% |
| Testes instáveis | 3 | 2 |
| Execuções totais | 54 | 54 |
| Custo por resultado | 6.399 | 19.226 |
| Custo total | $0.832 | $2.884 |
| Preço de entrada | $2.500 / 1M | $5.000 / 1M |
| Preço de saída | $15.000 / 1M | $30.000 / 1M |
| Tokens de saída | 2,169 | 1,920 |
| Tokens de raciocínio | 48,732 | 89,632 |
| Tempo de resposta (médio) | 18.63s | 32.75s |
| Tempo de resposta (máx.) | 100.41s | 332.10s |
| Tempo de resposta (total) | 335.26s | 589.59s |
Pontuação vs custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Detalhamento por categoria
Comparação rápida
Trocar par de comparação
GPT-5.4mediumvsHY3 PreviewlowDisponível grátisGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 PreviewhighDisponível grátisGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewhighDisponível grátisGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewlowDisponível grátis