Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs xAI: Grok 4.1 Fast

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 Grok 4.1 Fast Grok 4.1 Fast medium Релиз: 2025-11-19
Оценка 10.0 6.7
Ранг #1 #68
Надежность Н/Д Н/Д
Стабильность 10.0 7.2
Тестов верно
Доля успешных попыток 100.0% 64.8%
Нестабильные тесты 0 6
Всего запусков 18 54
Стоимость за результат 0.600 0.613
Общая стоимость $0.108 $0.056
???? ????? $0.500 / 1M $0.200 / 1M
???? ?????? $3.000 / 1M $0.500 / 1M
Выходные токены 655 2,010
Токены рассуждений 33,749 91,298
Время ответа (среднее) 12.11s 23.88s
Время ответа (макс.) 82.37s 121.79s
Время ответа (суммарно) 217.93s 262.66s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
Grok 4.1 Fast 8.7 7.9 91.7% 1 3.81s 108 4,741
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
Grok 4.1 Fast 2.3 1.1 33.3% 1 23.58s 821 6,703
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
Grok 4.1 Fast 10.0 10.0 100.0% 0 37.64s 261 12,272
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
Grok 4.1 Fast 10.0 10.0 100.0% 0 6.63s 180 5,409
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
Grok 4.1 Fast 5.8 4.4 66.7% 2 121.79s 11 37,657
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
Grok 4.1 Fast 4.2 9.9 0.0% 0 16.25s 127 3,456
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
Grok 4.1 Fast 6.5 10.0 50.0% 0 5.30s 55 3,489
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
Grok 4.1 Fast 5.3 7.2 44.4% 1 8.08s 187 6,086
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503
Grok 4.1 Fast 2.8 1.6 33.3% 1 27.71s 260 11,485

Быстрое сравнение

Сменить пару сравнения