AI BENCHY Compare

Gemini 3 PRO Preview vs Qwen: Qwen3.6 Max Preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Релиз: 2025-11-18	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20

Метрика	Gemini 3 PRO Preview Gemini 3 PRO Preview medium Релиз: 2025-11-18	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20
Оценка	8.4	7.2
Ранг	#10	#54
Надежность	Н/Д	10.0
Стабильность	10.0	9.1
Тестов верно
Доля успешных попыток	77.8%	64.9%
Нестабильные тесты	0	2
Всего запусков	57	57
Стоимость за результат	1.406	0.755
Общая стоимость	$0.197	$0.083
???? ?????	$0.000 / 1M	$1.040 / 1M
???? ??????	$0.000 / 1M	$6.240 / 1M
Выходные токены	1,508	4,751
Токены рассуждений	10,084	0
Время ответа (среднее)	9.06s	3.31s
Время ответа (макс.)	26.24s	20.51s
Время ответа (суммарно)	90.58s	62.80s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		14.99s	149	1,485
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		10.37s	351	952
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		10.84s	279	3,156
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	5.3	10.0	33.3%	0		7.01s	15	1,195
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		9.34s	78	374
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	9.8	10.0	100.0%	0		3.26s	69	754
Qwen3.6 Max Preview	9.8	10.0	100.0%	0		1.45s	69	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		3.91s	243	1,197
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		11.96s	324	971
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3 PRO Preview	0.0	0.0	0.0%	0		0ms	0	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		1.97s	19	0

Быстрое сравнение

Сменить пару сравнения

Ring 2.6 1tmediumБесплатно доступноvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsQwen3.6 Max Previewnone GPT-5.2mediumvsQwen3.6 Max Previewnone GPT-5.4 NanomediumvsQwen3.6 Max Previewnone DeepSeek V3.2mediumvsQwen3.6 Max Previewnone GPT-5.4 MinimediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Claude Opus 4.6mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsGLM 5V Turbomedium DeepSeek V4 FlashhighvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsGLM 5.1medium