AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#46

Grok Build 0.1

X AI Релиз: 2026-05-21 Проверено: 2026-05-22 00:36 x-ai/grok-build-0.1::medium
(medium) (none)

Сводка

Grok Build 0.1 набирает 7.6 в AI BENCHY и занимает #46. У модели надежность 10.0, доля успешных попыток 70.0%, общая стоимость $0.633 и среднее время ответа 26.36s.

Что делает Grok Build 0.1 особенной: Сильнее всего модель выделяется в Предметно-ориентированное, где занимает #3; самая слабая область — Программирование с #16. Она использует необычно много reasoning-токенов, что может объяснять более медленные или дорогие запуски.

Стабильность

8.5

Общее число выходных токенов

295,603

Общее число входных токенов

0

Цена входа

$1.000 / 1M

Цена выхода

$2.000 / 1M

Тестов верно

Ошибочных тестов: 8

Доля успешных попыток: 70.0%

Нестабильные тесты

4

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

26.36s

Время ответа (макс.): 103.89s

Время ответа (суммарно): 527.19s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#46 xAI: Grok Build 0.1

medium
Стоимость
$0.028
Время
81.3s
Токены
14,009 tok

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-06-04 14:22 Добавлен новый тест 7.4 10.0 $0.927 Сравнить
2026-05-26 13:30 Повторный тест 7.7 10.0 $0.729 Сравнить
2026-05-22 00:36 Набор изменён 7.6 10.0 $0.633 Текущий запуск

Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщее число входных токеновОбщая стоимостьВремя ответа (среднее)
2026-05-22 00:36 · Набор изменён7.68.510.012/204295,6030$0.63326.36s
2026-05-26 13:30 · Повторный тест7.79.910.013/200343,6390$0.72942.39s
Разница-0.1-1.40.0-1+4-480360-$0.097-16029ms

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 10.0 10.0
Программирование 5.3 2.9
Комбинированный 10.0 10.0
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 5.3 10.0
Общий интеллект 3.8 2.5
Следование инструкциям 9.8 10.0
Решение головоломок 6.2 7.5
Вызов инструментов 10.0 10.0
Эрудиция 3.0 10.0

Сравниваемые модели