AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02
Оценка	9.6	4.8
Ранг	#2	#105
Надежность	Н/Д	Н/Д
Стабильность	10.0	9.6
Тестов верно
Доля успешных попыток	94.4%	24.1%
Нестабильные тесты	0	1
Всего запусков	54	54
Стоимость за результат	3.400	0.116
Общая стоимость	$0.578	$0.005
???? ?????	$2.000 / 1M	$0.100 / 1M
???? ??????	$12.000 / 1M	$0.150 / 1M
Выходные токены	1,932	3,951
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	1.47s
Время ответа (макс.)	40.61s	5.91s
Время ответа (суммарно)	175.52s	26.43s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Qwen3.5-9B	3.1	9.9	0.0%	0		1.71s	582	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Qwen3.5-9B	5.2	3.4	33.3%	1		5.69s	1,006	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Qwen3.5-9B	3.0	10.0	0.0%	0		5.91s	1,255	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Qwen3.5-9B	10.0	10.0	100.0%	0		847ms	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Qwen3.5-9B	3.0	10.0	0.0%	0		464ms	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Qwen3.5-9B	4.4	9.9	0.0%	0		552ms	99	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Qwen3.5-9B	6.5	10.0	50.0%	0		514ms	75	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Qwen3.5-9B	3.2	9.9	0.0%	0		683ms	388	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

Быстрое сравнение

Сменить пару сравнения

Qwen3.5-9BnonevsGLM 4.7 Flashmedium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Elephant AlphamediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsQwen3.5-9Bnone Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Mistral Small 4mediumvsQwen3.5-9Bnone MiniMax M2.5mediumБесплатно доступноvsQwen3.5-9Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-9Bnone Gemini 3.1 Pro PreviewmediumvsHY3 PreviewhighБесплатно доступно Gemini 3.1 Pro PreviewmediumvsHY3 PreviewlowБесплатно доступно GPT-5 NanomediumvsQwen3.5-9Bnone Gemini 3.1 Pro PreviewmediumvsGPT-5.2 Chatnone