Google: Gemini 3.5 Flash vs Qwen: Qwen3.7 Max

Qwen3.7 Max (medium) лидирует по среднему баллу: 9.2 vs 6.8. Gemini 3.5 Flash (minimal) имеет более низкую стоимость benchmark: $0.300 vs $1.116. Gemini 3.5 Flash (minimal) быстрее: 2.65s vs 40.57s, с долей успешных попыток 65.2% vs 87.9%.

Рекомендуемая модельQwen3.7 Max (medium)У него самый высокий балл в этом сравнении (9.2) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19	Qwen3.7 Max Qwen3.7 Max medium Релиз: 2026-05-22

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19	Qwen3.7 Max Qwen3.7 Max medium Релиз: 2026-05-22
Оценка	6.8	9.2
Ранг	#96	#13
Надежность	10.0	10.0
Стабильность	9.6	9.3
Тестов верно
Доля успешных попыток	65.2%	87.9%
Нестабильные тесты	1	2
Всего запусков	66	66
Стоимость за результат	2.138	8.292
Общая стоимость	$0.300	$1.116
Цена входа	$1.500 / 1M	$1.475 / 1M
Цена выхода	$9.000 / 1M	$4.425 / 1M
Общее число входных токенов	100,753	106,020
Выходные токены	16,454	5,748
Токены рассуждений	0	211,004
Время ответа (среднее)	2.65s	40.57s
Время ответа (макс.)	25.26s	556.06s
Время ответа (суммарно)	58.27s	892.57s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#96 Gemini 3.5 Flash

minimal

Стоимость: $0.041
Время: 20.4s
Токены: 4,608 tok

#13 Qwen3.7 Max

medium

Стоимость: $0.017
Время: 68.8s
Токены: 4,526 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0
Qwen3.7 Max	10.0	10.0	100.0%	0		6.36s	672	222	8,742

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0
Qwen3.7 Max	10.0	10.0	100.0%	0		35.31s	7,893	423	34,808

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0
Qwen3.7 Max	8.7	6.9	83.3%	1		287.83s	78,594	3,985	96,450

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0
Qwen3.7 Max	10.0	10.0	100.0%	0		8.80s	7,782	270	6,254

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0
Qwen3.7 Max	5.9	7.2	55.6%	1		24.94s	771	61	31,793

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0
Qwen3.7 Max	10.0	10.0	100.0%	0		11.70s	516	135	4,457

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0
Qwen3.7 Max	10.0	10.0	100.0%	0		7.46s	699	102	5,452

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0
Qwen3.7 Max	10.0	10.0	100.0%	0		8.84s	696	259	8,908

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0
Qwen3.7 Max	10.0	10.0	100.0%	0		6.63s	8,193	267	1,220

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0
Qwen3.7 Max	3.0	10.0	0.0%	0		33.37s	204	24	12,920

Быстрое сравнение

Сменить пару сравнения