AI BENCHY Compare

Google: Gemini 3.5 Flash vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19	Hunter Alpha Hunter Alpha none Релиз: 2026-03-11

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19	Hunter Alpha Hunter Alpha none Релиз: 2026-03-11
Оценка	9.3	5.7
Ранг	#3	#108
Надежность	10.0	Н/Д
Стабильность	10.0	8.2
Тестов верно
Доля успешных попыток	90.0%	46.3%
Нестабильные тесты	0	4
Всего запусков	60	52
Стоимость за результат	1.582	0.000
Общая стоимость	$0.285	$0.000
???? ?????	$1.500 / 1M	$0.000 / 1M
???? ??????	$9.000 / 1M	$0.000 / 1M
Выходные токены	2,027	2,278
Токены рассуждений	23,938	0
Время ответа (среднее)	2.98s	4.58s
Время ответа (макс.)	6.44s	15.17s
Время ответа (суммарно)	59.59s	77.92s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	209	2,536
Hunter Alpha	3.5	8.0	16.7%	1		3.81s	779	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.8	10.0	50.0%	0		5.54s	452	6,839
Hunter Alpha	3.0	10.0	0.0%	0		0ms	0	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.44s	351	3,050
Hunter Alpha	3.0	10.0	0.0%	0		15.17s	379	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.81s	279	1,164
Hunter Alpha	10.0	10.0	100.0%	0		8.49s	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.7	10.0	66.7%	0		3.39s	12	4,538
Hunter Alpha	5.3	10.0	33.3%	0		2.33s	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.27s	119	916
Hunter Alpha	6.1	3.1	66.7%	1		2.71s	91	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	9.9	10.0	100.0%	0		1.86s	71	1,652
Hunter Alpha	6.4	10.0	50.0%	0		2.82s	69	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.35s	288	2,150
Hunter Alpha	5.8	4.4	66.7%	2		3.06s	349	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.27s	234	403
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.88s	12	690
Hunter Alpha	-	-	-	-	-	-	-	-

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashlowvsQwen3.7 Maxmedium Claude Opus 4.7mediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsGPT-5.5medium Gemini 3.5 FlashlowvsQwen3.6 Max Previewmedium Gemini 3.5 FlashlowvsGPT-5.3-Codexmedium Gemini 3.5 FlashlowvsGLM 5medium Gemini 3.5 FlashlowvsQwen3.5 Plus 2026-02-15medium Seed-2.0-LitemediumvsGemini 3.5 Flashlow Gemini 3.5 FlashlowvsQwen3.5-27Bmedium Gemini 3.5 FlashlowvsQwen3.7 Maxnone Gemini 3.5 FlashlowvsGPT-5.4medium Gemini 3.5 FlashlowvsGLM 5 Turbomedium