Gemini 3.1 Pro Preview (medium) vs Qwen3.7 Max

Рекомендуемая модель Qwen3.7 Max

Он дает лучший общий компромисс: конкурентный балл (7.4), ниже стоимость, чем у Gemini 3.1 Pro Preview (medium), и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Сводка сравнения

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22

Метрика	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22
Оценка	9.2	7.4
Ранг	#10	#67
Надежность	10.0	9.9
Стабильность	10.0	10.0
Тестов верно
Доля успешных попыток	90.9%	68.2%
Нестабильные тесты	0	0
Всего запусков	66	66
Стоимость за результат	6.801	1.582
Общая стоимость	$1.361	$0.197
Цена входа	$2.000 / 1M	$1.475 / 1M
Цена выхода	$12.000 / 1M	$4.425 / 1M
Общее число входных токенов	92,287	95,983
Выходные токены	5,232	12,446
Токены рассуждений	92,726	0
Время ответа (среднее)	21.47s	4.52s
Время ответа (макс.)	88.68s	72.30s
Время ответа (суммарно)	322.08s	99.52s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Сменить пару сравнения