Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.6 Max Preview

Qwen3.6 Max Preview лидирует по среднему баллу: 6.6 vs 6.5. Qwen3.6 Max Preview имеет более низкую стоимость benchmark: $0.231 vs $0.621. Qwen3.6 Max Preview быстрее: 7.82s vs 16.26s, с долей успешных попыток 59.1% vs 60.6%.

Рекомендуемая модельQwen3.6 Max PreviewЗдесь у него лучший балл (6.6), при этом он примерно в 2.7 раза дешевле, чем Gemini 3.1 Flash Lite (low).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Релиз: 2026-05-08	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Релиз: 2026-05-08	Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20
Оценка	6.5	6.6
Ранг	#100	#93
Надежность	10.0	9.9
Стабильность	9.2	9.3
Тестов верно
Доля успешных попыток	59.1%	60.6%
Нестабильные тесты	2	2
Всего запусков	66	66
Стоимость за результат	5.170	2.061
Общая стоимость	$0.621	$0.231
Цена входа	$0.250 / 1M	$1.040 / 1M
Цена выхода	$1.500 / 1M	$6.240 / 1M
Общее число входных токенов	94,224	106,339
Выходные токены	7,759	19,257
Токены рассуждений	390,126	0
Время ответа (среднее)	16.26s	7.82s
Время ответа (макс.)	318.02s	102.62s
Время ответа (суммарно)	357.64s	172.01s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#100 Gemini 3.1 Flash Lite

low

Стоимость: $0.003
Время: 4.0s
Токены: 1,479 tok

#93 Qwen3.6 Max Preview

none

Стоимость: $0.025
Время: 83.9s
Токены: 4,066 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	696	513	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
Qwen3.6 Max Preview	3.8	7.3	22.2%	1		3.12s	7,913	456	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.2	9.1	0.0%	0		161.25s	70,202	5,375	381,841
Qwen3.6 Max Preview	6.5	10.0	50.0%	0		61.56s	78,779	17,320	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	789	18	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	522	76	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
Qwen3.6 Max Preview	9.8	10.0	100.0%	0		1.40s	711	69	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.65s	714	321	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		1.97s	210	19	0

Быстрое сравнение

Сменить пару сравнения