#119 xAI: Grok 4.20
none- Стоимость
- $0.004
- Время
- 6.5s
- Токены
- 1,367 tok
Сводка
Grok 4.20 набирает 5.4 в AI BENCHY и занимает #119. У модели надежность Н/Д, доля успешных попыток 35.2%, общая стоимость $0.095 и среднее время ответа 1.11s.
Что делает Grok 4.20 особенной: Сильнее всего модель выделяется в Анти-ИИ уловки, где занимает #3; самая слабая область — Программирование с #11. Она заметно быстрее похожих моделей.
Примечание об идентичности
Grok 4.20 Beta был превью-версией Grok 4.20.
5.4
Стабильность
9.5
Н/Д
Общее число выходных токенов
1,967
Общее число входных токенов
0
Цена входа
$1.250 / 1M
Цена выхода
$2.500 / 1M
Нестабильные тесты
1
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
Генерация showcase
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
История запусков
| Проверено | Оценка | Надежность | Тестов верно | Общая стоимость | Сравнить |
|---|---|---|---|---|---|
| 2026-05-06 14:16 Повторный тест | 5.4 | Н/Д | $0.057 ↓ | Сравнить | |
| 2026-05-06 14:16 Повторный тест | 5.4 | Н/Д | $0.095 | Сравнить | |
| 2026-05-06 14:16 Повторный тест | 5.4 | Н/Д | $0.095 | Сравнить | |
| 2026-05-06 14:16 Набор изменён | 5.4 | Н/Д | $0.095 | Текущий запуск | |
| 2026-04-11 01:44 Первый зафиксированный запуск | 5.2 | Н/Д | $0.095 | Сравнить |
Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
| Категория | Оценка | Стабильность | Тестов верно |
|---|---|---|---|
| Анти-ИИ уловки | 4.8 | 10.0 | |
| Программирование | 3.4 | 9.3 | |
| Комбинированный | 3.0 | 10.0 | |
| Парсинг и извлечение данных | 10.0 | 10.0 | |
| Предметно-ориентированное | 3.0 | 10.0 | |
| Общий интеллект | 4.8 | 10.0 | |
| Следование инструкциям | 6.3 | 10.0 | |
| Решение головоломок | 5.3 | 7.2 | |
| Вызов инструментов | 10.0 | 10.0 |