AI BENCHY Compare
xAI: Grok 4.20 vs xAI: Grok 4.3
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01
| Метрика | Grok 4.20 Grok 4.20 medium | Grok 4.3 Grok 4.3 medium |
|---|---|---|
| Оценка | 7.0 | 8.2 |
| Ранг | #63 | #20 |
| Надежность | Н/Д | 10.0 |
| Стабильность | 7.8 | 8.6 |
| Тестов верно | ||
| Доля успешных попыток | 66.7% | 81.5% |
| Нестабильные тесты | 5 | 3 |
| Всего запусков | 54 | 54 |
| Стоимость за результат | 8.252 | 3.974 |
| Общая стоимость | $0.743 | $0.517 |
| ???? ????? | $2.000 / 1M | $1.250 / 1M |
| ???? ?????? | $6.000 / 1M | $2.500 / 1M |
| Выходные токены | 1,744 | 1,223 |
| Токены рассуждений | 109,882 | 187,047 |
| Время ответа (среднее) | 10.33s | 48.63s |
| Время ответа (макс.) | 29.87s | 216.69s |
| Время ответа (суммарно) | 185.87s | 875.27s |
Оценка vs общая стоимость
Время ответа (среднее)
Оценка vs Время ответа (среднее)
Общее число выходных токенов
Оценка vs Общее число выходных токенов
Разбивка по категориям
Быстрое сравнение
Сменить пару сравнения
DeepSeek V4 ProhighvsGrok 4.20mediumGemma 4 31BnoneБесплатно доступноvsGrok 4.20mediumHY3 PreviewlowБесплатно доступноvsGrok 4.3mediumGemini 3 Flash PreviewnonevsGrok 4.3mediumGemini 3.1 Flash Lite PreviewlowvsGrok 4.3mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumGPT-5.5nonevsGrok 4.20mediumGPT-5.2 ChatnonevsGrok 4.3mediumGrok 4.20mediumvsGLM 5noneGemini 3.1 Flash Lite PreviewnonevsGrok 4.3mediumGPT-5.3 ChatnonevsGrok 4.3mediumHY3 PreviewhighБесплатно доступноvsGrok 4.3medium