Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs xAI: Grok 4.3

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19 Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01
Оценка 8.1 8.0
Ранг #21 #29
Надежность 10.0 10.0
Стабильность 9.6 8.7
Тестов верно
Доля успешных попыток 75.4% 77.2%
Нестабильные тесты 1 3
Всего запусков 57 57
Стоимость за результат 0.494 4.229
Общая стоимость $0.070 $0.550
???? ????? $1.500 / 1M $1.250 / 1M
???? ?????? $9.000 / 1M $2.500 / 1M
Выходные токены 2,262 1,237
Токены рассуждений 0 200,033
Время ответа (среднее) 1.37s 48.41s
Время ответа (макс.) 3.56s 216.69s
Время ответа (суммарно) 26.04s 919.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 405 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.28s 441 0
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 404 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 279 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 12 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 117 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 76 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 282 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 234 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 12 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986

Быстрое сравнение

Сменить пару сравнения