AI BENCHY Compare
OpenAI: GPT-5.4 vs xAI: Grok 4.20
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-02
| Метрика | GPT-5.4 GPT-5.4 none | Grok 4.20 Grok 4.20 none |
|---|---|---|
| Оценка | 5.6 | 5.4 |
| Ранг | #64 | #69 |
| Стабильность | 9.0 | 9.5 |
| Тестов верно | ||
| Доля успешных попыток | 39.2% | 31.4% |
| Нестабильные тесты | 2 | 1 |
| Всего запусков | 51 | 51 |
| Стоимость за результат | 1.573 | 1.809 |
| Общая стоимость | $0.095 | $0.091 |
| ???? ????? | $2.500 / 1M | $2.000 / 1M |
| ???? ?????? | $15.000 / 1M | $6.000 / 1M |
| Выходные токены | 1,837 | 1,655 |
| Токены рассуждений | 0 | 0 |
| Время ответа (среднее) | 1.43s | 1.11s |
| Время ответа (макс.) | 2.89s | 6.04s |
| Время ответа (суммарно) | 24.27s | 18.80s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
Mistral Small 4mediumvsGPT-5.4noneMistral Small 4mediumvsGrok 4.20noneMiniMax M2.5mediumБесплатно доступноvsGPT-5.4noneMiniMax M2.7mediumvsGrok 4.20noneMiniMax M2.5mediumБесплатно доступноvsGrok 4.20noneQwen3 Coder NextmediumvsGrok 4.20noneGPT-5.4nonevsGrok 4.20 Multi Agent Betamediumgpt-oss-120bmediumБесплатно доступноvsGrok 4.20noneMiniMax M2.7mediumvsGPT-5.4noneMercury 2mediumvsGPT-5.4noneGrok 4.20nonevsGLM 4.7 FlashmediumGPT-5.4nonevsQwen3 Coder Nextmedium