Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.7 Max

Qwen3.7 Max лидирует по среднему баллу: 7.4 vs 7.3. Gemini 3.1 Flash Lite Preview (medium) имеет более низкую стоимость benchmark: $0.115 vs $0.197. Qwen3.7 Max быстрее: 4.52s vs 4.61s, с долей успешных попыток 59.1% vs 68.2%.

Рекомендуемая модельGemini 3.1 Flash Lite Preview (medium)Его балл близок к лучшему здесь (7.3 против 7.4), при этом он примерно в 1.7 раза дешевле, чем Qwen3.7 Max.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Релиз: 2026-03-03	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Релиз: 2026-03-03	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22
Оценка	7.3	7.4
Ранг	#61	#57
Надежность	10.0	9.9
Стабильность	9.9	10.0
Тестов верно
Доля успешных попыток	59.1%	68.2%
Нестабильные тесты	0	0
Всего запусков	66	66
Стоимость за результат	0.884	1.582
Общая стоимость	$0.115	$0.197
Цена входа	$0.250 / 1M	$1.475 / 1M
Цена выхода	$1.500 / 1M	$4.425 / 1M
Общее число входных токенов	117,480	95,983
Выходные токены	10,589	12,446
Токены рассуждений	46,394	0
Время ответа (среднее)	4.61s	4.52s
Время ответа (макс.)	18.34s	72.30s
Время ответа (суммарно)	101.39s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#61 Gemini 3.1 Flash Lite Preview

medium

Стоимость: $0.003
Время: 5.2s
Токены: 1,944 tok

#57 Qwen3.7 Max

none

Стоимость: $0.046
Время: 195.0s
Токены: 12,171 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	512	570	4,305
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		4.09s	8,126	461	8,597
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	7.2	9.1	50.0%	0		16.63s	93,097	8,706	16,997
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	7,362	279	2,952
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	639	18	5,325
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	488	96	1,488
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	621	72	2,121
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		5.30s	566	141	1,896
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	5,909	234	912
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		2.68s	160	12	1,801
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsGemini 3.1 Flash Lite Previewmedium GPT-5.4 MinimediumvsQwen3.7 Maxnone Claude Opus 4.8nonevsGemini 3.1 Flash Lite Previewmedium GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5low Gemini 3.1 Flash Lite PreviewmediumvsStep 3.7 Flashlow Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone GPT-5.4 NanomediumvsQwen3.7 Maxnone Gemini 3.1 Flash Lite PreviewmediumvsKAT-Coder-Pro V2.5high Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumБесплатно доступноvsQwen3.7 Maxnone