Gemini 3.1 Flash Lite Preview (low) vs Qwen3.5 Plus 2026-02-15

Gemini 3.1 Flash Lite Preview (low) лидирует по среднему баллу: 6.5 vs 6.4. Qwen3.5 Plus 2026-02-15 имеет более низкую стоимость benchmark: $0.073 vs $0.646. Qwen3.5 Plus 2026-02-15 быстрее: 9.85s vs 16.70s, с долей успешных попыток 59.1% vs 48.5%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-28

Ранг: #117
Общее число выходных токенов: 412,200
Время ответа (среднее): 16.70s
Общая стоимость: $0.646

Ранг: #120
Общее число выходных токенов: 29,370
Время ответа (среднее): 9.85s
Общая стоимость: $0.073

Рекомендуемая модель Qwen3.5 Plus 2026-02-15

Его балл близок к лучшему здесь (6.4 против 6.5), при этом он примерно в 8.9 раза дешевле, чем Gemini 3.1 Flash Lite Preview (low).

Подробное сравнение

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Релиз: 2026-02-15
Оценка	6.5	6.4
Ранг	#117	#120
Надежность	10.0	10.0
Стабильность	10.0	9.4
Тестов верно
Доля успешных попыток	59.1%	48.5%
Нестабильные тесты	0	2
Всего запусков	66	66
Стоимость за результат	4.969	0.751
Общая стоимость	$0.646	$0.073
Цена входа	$0.250 / 1M	$0.260 / 1M
Цена выхода	$1.500 / 1M	$1.560 / 1M
Общее число входных токенов	110,185	102,646
Выходные токены	14,717	29,370
Токены рассуждений	397,483	0
Время ответа (среднее)	16.70s	9.85s
Время ответа (макс.)	309.35s	123.00s
Время ответа (суммарно)	367.47s	157.63s

Генерация showcase моделей

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Gemini 3.1 Flash Lite Preview

low

Стоимость: $0.002
Время: 3.7s
Токены: 1,203 tok

#120 Qwen3.5 Plus 2026-02-15

none

Стоимость: $0.012
Время: 153.2s
Токены: 7,787 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	696	517	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060
Qwen3.5 Plus 2026-02-15	4.3	7.9	11.1%	1		2.05s	7,913	473	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079
Qwen3.5 Plus 2026-02-15	6.5	10.0	50.0%	0		64.83s	75,086	27,204	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	789	17	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	522	117	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.71s	714	494	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	210	11	0

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bnone Gemini 3.1 Flash Lite PreviewlowvsLaguna XS 2.1mediumБесплатно доступно Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 27Bmedium Gemini 3.1 Flash LitelowvsQwen3.5 Plus 2026-02-15none Ling 3.0 FlashhighБесплатно доступноvsQwen3.5 Plus 2026-02-15none Laguna XS 2.1mediumБесплатно доступноvsQwen3.5 Plus 2026-02-15none Qwen3.5 Plus 2026-02-15nonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Max Previewnone Ring-2.6-1TmediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsLing 3.0 FlashhighБесплатно доступно Gemini 3.1 Flash Lite PreviewlowvsLongCat 2.0high