AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-30

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Релиз: 2026-03-03	Qwen3.5-Flash Qwen3.5-Flash none Релиз: 2026-02-24

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Релиз: 2026-03-03	Qwen3.5-Flash Qwen3.5-Flash none Релиз: 2026-02-24
Оценка	8.2	6.2
Ранг	#23	#78
Надежность	Н/Д	Н/Д
Стабильность	10.0	9.6
Тестов верно
Доля успешных попыток	72.2%	46.3%
Нестабильные тесты	0	1
Всего запусков	54	54
Стоимость за результат	0.419	0.070
Общая стоимость	$0.055	$0.006
???? ?????	$0.250 / 1M	$0.065 / 1M
???? ??????	$1.500 / 1M	$0.260 / 1M
Выходные токены	2,168	4,266
Токены рассуждений	29,030	0
Время ответа (среднее)	3.74s	3.25s
Время ответа (макс.)	14.93s	13.73s
Время ответа (суммарно)	67.31s	58.44s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
Qwen3.5-Flash	3.5	8.3	8.3%	1		1.32s	690	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		4.34s	431	2,684
Qwen3.5-Flash	10.0	10.0	100.0%	0		1.29s	489	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
Qwen3.5-Flash	3.0	10.0	0.0%	0		6.22s	1,794	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
Qwen3.5-Flash	10.0	10.0	100.0%	0		1.57s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
Qwen3.5-Flash	7.7	10.0	66.7%	0		905ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
Qwen3.5-Flash	10.0	10.0	100.0%	0		803ms	100	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
Qwen3.5-Flash	6.3	10.0	50.0%	0		8.81s	63	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
Qwen3.5-Flash	3.3	10.0	0.0%	0		5.90s	608	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
Qwen3.5-Flash	10.0	10.0	100.0%	0		3.67s	264	0

Быстрое сравнение

Сменить пару сравнения

Laguna Xs.2mediumБесплатно доступноvsQwen3.5-Flashnone Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewlowБесплатно доступно Laguna M.1mediumБесплатно доступноvsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.5-Flashnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Mercury 2mediumvsQwen3.5-Flashnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-Flashnone Owl AlphamediumvsQwen3.5-Flashnone DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewmedium Gemini 3.1 Flash Lite PreviewmediumvsHY3 PreviewhighБесплатно доступно Nemotron 3 SupermediumБесплатно доступноvsQwen3.5-Flashnone