AI BENCHY Compare
OpenAI: GPT-5.4 vs xAI: Grok 4.20
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16
| Метрика | GPT-5.4 GPT-5.4 none | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| Оценка | 5.9 | 7.0 |
| Ранг | #65 | #46 |
| Стабильность | 9.1 | 7.8 |
| Тестов верно | ||
| Доля успешных попыток | 42.6% | 66.7% |
| Нестабильные тесты | 2 | 5 |
| Всего запусков | 54 | 54 |
| Стоимость за результат | 1.477 | 8.252 |
| Общая стоимость | $0.104 | $0.743 |
| ???? ????? | $2.500 / 1M | $2.000 / 1M |
| ???? ?????? | $15.000 / 1M | $6.000 / 1M |
| Выходные токены | 2,317 | 1,744 |
| Токены рассуждений | 0 | 109,882 |
| Время ответа (среднее) | 1.51s | 10.33s |
| Время ответа (макс.) | 2.95s | 29.87s |
| Время ответа (суммарно) | 27.21s | 185.87s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
Gemma 4 31BnoneБесплатно доступноvsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumMiniMax M2.5mediumБесплатно доступноvsGPT-5.4noneMistral Small 4mediumvsGPT-5.4noneGrok 4.20mediumvsGLM 5noneClaude Sonnet 4.6nonevsGrok 4.20mediumGrok 4.20mediumvsMiMo-V2-OmninoneMercury 2mediumvsGPT-5.4noneMiniMax M2.7mediumvsGPT-5.4noneGPT-5.4nonevsElephantmediumGPT-5.3 ChatnonevsGrok 4.20mediumGrok 4.20mediumvsGLM 5V Turbonone