Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.7 Max

Qwen3.7 Max лидирует по среднему баллу: 7.4 vs 7.3. Gemini 3.1 Flash Lite (medium) имеет более низкую стоимость benchmark: $0.117 vs $0.197. Gemini 3.1 Flash Lite (medium) быстрее: 4.27s vs 4.52s, с долей успешных попыток 62.1% vs 68.2%.

Рекомендуемая модельGemini 3.1 Flash Lite (medium)Его балл близок к лучшему здесь (7.3 против 7.4), при этом он примерно в 1.7 раза дешевле, чем Qwen3.7 Max.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-17

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22
Оценка	7.3	7.4
Ранг	#62	#57
Надежность	10.0	9.9
Стабильность	9.2	10.0
Тестов верно
Доля успешных попыток	62.1%	68.2%
Нестабильные тесты	2	0
Всего запусков	66	66
Стоимость за результат	0.898	1.582
Общая стоимость	$0.117	$0.197
Цена входа	$0.250 / 1M	$1.475 / 1M
Цена выхода	$1.500 / 1M	$4.425 / 1M
Общее число входных токенов	104,918	95,983
Выходные токены	9,168	12,446
Токены рассуждений	51,130	0
Время ответа (среднее)	4.27s	4.52s
Время ответа (макс.)	26.22s	72.30s
Время ответа (суммарно)	94.02s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 Gemini 3.1 Flash Lite

medium

Стоимость: $0.003
Время: 5.3s
Токены: 1,754 tok

#57 Qwen3.7 Max

none

Стоимость: $0.046
Время: 195.0s
Токены: 12,171 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	502	604	4,201
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		3.81s	8,134	459	8,978
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.2	9.1	50.0%	0		18.55s	80,983	7,241	20,231
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	7,362	279	2,845
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	643	15	5,165
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	488	84	1,142
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	623	75	3,320
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	568	165	2,450
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	5,457	234	921
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	158	12	1,877
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Быстрое сравнение

Сменить пару сравнения

Claude Opus 4.8nonevsGemini 3.1 Flash Litemedium Claude Sonnet 4.6nonevsGemini 3.1 Flash Litemedium Gemini 3.1 Flash LitemediumvsStep 3.7 Flashlow GPT-5.4 MinimediumvsQwen3.7 Maxnone GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone Gemini 3.1 Flash LitemediumvsKAT-Coder-Pro V2.5low KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone Gemini 3.1 Flash LitemediumvsKAT-Coder-Pro V2.5high GPT-5.4 NanomediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Maxnone Nemotron 3 UltramediumБесплатно доступноvsQwen3.7 Maxnone