AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen3.6 Plus Preview

Сводка

Сравнение benchmark Gemini 3.5 Flash vs Qwen3.6 Plus Preview: Gemini 3.5 Flash лидирует по среднему баллу: 9.8 vs 5.8. Qwen3.6 Plus Preview имеет более низкую стоимость benchmark: $0.000 vs $1.115. Gemini 3.5 Flash быстрее: 8.84s vs 15.25s, с долей успешных попыток 96.8% vs 42.9%.

Рекомендуемая модель: Gemini 3.5 Flash - Здесь у него лучший балл (9.8), и он отвечает примерно в 1.7 раза быстрее, чем Qwen3.6 Plus Preview.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно

Метрика	Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно
Оценка	9.8	5.8
Ранг	#1	#113
Надежность	10.0	Н/Д
Стабильность	9.6	9.0
Тестов верно
Доля успешных попыток	96.8%	42.9%
Нестабильные тесты	1	0
Всего запусков	63	57
Стоимость за результат	5.575	0.000
Общая стоимость	$1.115	$0.000
Цена входа	$1.500 / 1M	$0.000 / 1M
Цена выхода	$9.000 / 1M	$0.000 / 1M
Общее число входных токенов	37,594	32,639
Выходные токены	1,975	1,153
Токены рассуждений	115,638	62,197
Время ответа (среднее)	8.84s	15.25s
Время ответа (макс.)	34.82s	43.55s
Время ответа (суммарно)	185.57s	182.96s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#1 Gemini 3.5 Flash

high

Стоимость: $0.208
Время: 118.2s
Токены: 23,158 tok

#113 Qwen3.6 Plus Preview

medium

Для этой модели еще не сгенерирован результат showcase.

Стоимость: $0.000
Время: -
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.57s	492	174	4,997
Qwen3.6 Plus Preview	8.3	10.0	75.0%	0		11.69s	501	61	5,812

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.96s	8,118	456	47,129
Qwen3.6 Plus Preview	9.8	3.3	0.0%	0		0ms	0	0	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		22.37s	12,873	351	16,323
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	14,934	452	13,073

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		6.43s	7,548	279	8,466
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	7.6	7.2	77.8%	1		14.09s	633	12	24,721
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	665	49	26,895

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.63s	486	115	1,650
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		0ms	0	0	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.35s	615	70	3,799
Qwen3.6 Plus Preview	6.5	10.0	50.0%	0		3.40s	381	27	1,383

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.23s	558	241	4,940
Qwen3.6 Plus Preview	5.3	10.0	33.3%	0		7.52s	183	27	2,998

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	9.8	10.0	100.0%	0		4.96s	6,115	265	1,608
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.94s	156	12	2,005
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		0ms	0	0	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.5 FlashhighvsQwen3.7 Maxmedium Gemini 3.5 FlashhighvsGPT-5.5low Claude Fable 5mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGPT-5.5medium Gemini 3.5 FlashhighvsGPT-5.3-Codexmedium Gemini 3.5 FlashhighvsQwen3.6 Max Previewmedium Claude Opus 4.8mediumvsGemini 3.5 Flashhigh Claude Opus 4.7mediumvsGemini 3.5 Flashhigh Gemini 3.5 FlashhighvsGLM 5.2medium Gemini 3.5 FlashhighvsGLM 5medium Gemini 3.5 FlashhighvsGPT-5 Minimedium Gemini 3.5 FlashhighvsGPT-5.4medium