Google: Gemini 3.5 Flash vs Qwen: Qwen3.6 Max Preview

Gemini 3.5 Flash (medium) лидирует по среднему баллу: 9.1 vs 8.4. Gemini 3.5 Flash (medium) имеет более низкую стоимость benchmark: $0.642 vs $1.143. Gemini 3.5 Flash (medium) быстрее: 8.20s vs 67.53s, с долей успешных попыток 87.9% vs 80.3%.

Рекомендуемая модельGemini 3.5 Flash (medium)Здесь у него лучший балл (9.1), при этом он примерно в 1.8 раза дешевле, чем Qwen3.6 Max Preview (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash medium Релиз: 2026-05-19	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20
Оценка	9.1	8.4
Ранг	#14	#25
Надежность	10.0	9.9
Стабильность	9.7	8.9
Тестов верно
Доля успешных попыток	87.9%	80.3%
Нестабильные тесты	1	3
Всего запусков	66	66
Стоимость за результат	3.374	8.173
Общая стоимость	$0.642	$1.143
Цена входа	$1.500 / 1M	$1.040 / 1M
Цена выхода	$9.000 / 1M	$6.240 / 1M
Общее число входных токенов	69,747	79,240
Выходные токены	2,166	5,098
Токены рассуждений	57,436	164,842
Время ответа (среднее)	8.20s	67.53s
Время ответа (макс.)	76.68s	238.07s
Время ответа (суммарно)	180.47s	1485.64s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#14 Gemini 3.5 Flash

medium

Стоимость: $0.201
Время: 112.9s
Токены: 22,371 tok

#25 Qwen3.6 Max Preview

medium

Стоимость: $0.024
Время: 76.5s
Токены: 3,861 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	492	171	3,385
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.9	7.5	77.8%	1		12.63s	8,118	461	24,939
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		44.36s	45,684	516	8,835
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	7,548	279	3,784
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	633	12	8,047
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	486	115	1,144
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	615	71	2,855
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	558	295	2,747
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	5,457	234	455
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	156	12	1,245
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Быстрое сравнение

Сменить пару сравнения

Qwen3.6 Max PreviewmediumvsGrok 4.5low Claude Opus 5highvsGemini 3.5 Flashmedium Claude Opus 5lowvsQwen3.6 Max Previewmedium Muse Spark 1.1lowvsQwen3.6 Max Previewmedium Gemini 3.5 FlashmediumvsGrok 4.5high Gemini 3.5 FlashmediumvsGPT-5.5low Gemini 3.5 FlashmediumvsGPT-5.6 Solhigh Muse Spark 1.1highvsQwen3.6 Max Previewmedium Gemini 3.5 Flash-LitehighvsQwen3.6 Max Previewmedium Qwen3.6 Max PreviewmediumvsInklinghigh GPT-5.2 ChatnonevsQwen3.6 Max Previewmedium Gemini 3.5 FlashmediumvsGPT-5.6 Sollow