AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5 Plus 2026-04-20

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-27

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Релиз: 2026-04-20

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none Релиз: 2026-04-20
Оценка	9.6	5.8
Ранг	#2	#88
Надежность	Н/Д	9.8
Стабильность	10.0	8.3
Тестов верно
Доля успешных попыток	94.4%	42.6%
Нестабильные тесты	0	4
Всего запусков	54	54
Стоимость за результат	3.400	0.397
Общая стоимость	$0.578	$0.024
???? ?????	$2.000 / 1M	$0.400 / 1M
???? ??????	$12.000 / 1M	$2.400 / 1M
Выходные токены	1,932	4,645
Токены рассуждений	40,542	0
Время ответа (среднее)	15.96s	3.18s
Время ответа (макс.)	40.61s	13.32s
Время ответа (суммарно)	175.52s	57.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201
Qwen3.5 Plus 2026-04-20	5.3	3.4	33.3%	1		3.20s	450	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117
Qwen3.5 Plus 2026-04-20	4.8	7.9	22.2%	1		2.03s	618	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0

Быстрое сравнение

Сменить пару сравнения

gpt-oss-120bmediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none MiniMax M2.5mediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none Mistral Small 4mediumvsQwen3.5 Plus 2026-04-20none Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none MiniMax M2.7mediumvsQwen3.5 Plus 2026-04-20none Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Elephant AlphamediumvsQwen3.5 Plus 2026-04-20none Mercury 2mediumvsQwen3.5 Plus 2026-04-20none Qwen3.5 Plus 2026-04-20nonevsGrok 4.1 Fastmedium Nemotron 3 SupermediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none DeepSeek V4 ProhighvsQwen3.5 Plus 2026-04-20none