AI BENCHY Compare
OpenAI: GPT-5.4 vs OpenAI: GPT-5.5
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24
| Метрика | GPT-5.4 GPT-5.4 medium | GPT-5.5 GPT-5.5 medium |
|---|---|---|
| Оценка | 8.2 | 9.0 |
| Ранг | #18 | #5 |
| Надежность | Н/Д | Н/Д |
| Стабильность | 8.7 | 9.2 |
| Тестов верно | ||
| Доля успешных попыток | 79.6% | 87.0% |
| Нестабильные тесты | 3 | 2 |
| Всего запусков | 54 | 54 |
| Стоимость за результат | 6.399 | 19.226 |
| Общая стоимость | $0.832 | $2.884 |
| ???? ????? | $2.500 / 1M | $5.000 / 1M |
| ???? ?????? | $15.000 / 1M | $30.000 / 1M |
| Выходные токены | 2,169 | 1,920 |
| Токены рассуждений | 48,732 | 89,632 |
| Время ответа (среднее) | 18.63s | 32.75s |
| Время ответа (макс.) | 100.41s | 332.10s |
| Время ответа (суммарно) | 335.26s | 589.59s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
GPT-5.4mediumvsHY3 PreviewlowБесплатно доступноGemini 3 Flash PreviewnonevsGPT-5.4mediumGemini 3.1 Flash Lite PreviewlowvsGPT-5.4mediumGemini 3 Flash PreviewlowvsGPT-5.5mediumClaude Opus 4.7nonevsGPT-5.5mediumGPT-5.4mediumvsHY3 PreviewhighБесплатно доступноGemini 3.1 Flash Lite PreviewnonevsGPT-5.4mediumDeepSeek V4 FlashhighvsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewhighБесплатно доступноGemini 3 Flash PreviewlowvsGPT-5.4mediumClaude Sonnet 4.6nonevsGPT-5.4mediumGPT-5.5mediumvsHY3 PreviewlowБесплатно доступно