Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.6 Max Preview

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite vs Qwen3.6 Max Preview: Gemini 3.1 Flash Lite лидирует по среднему баллу: 6.1 vs 6.0. Gemini 3.1 Flash Lite имеет более низкую стоимость benchmark: $0.013 vs $0.075. Gemini 3.1 Flash Lite быстрее: 1.33s vs 3.30s, с долей успешных попыток 54.0% vs 58.7%.

Рекомендуемая модель: Gemini 3.1 Flash Lite - Здесь у него лучший балл (6.1), при этом он примерно в 5.7 раза дешевле, чем Qwen3.6 Max Preview.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Релиз: 2026-05-08 Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20
Оценка 6.1 6.0
Ранг #95 #104
Надежность 10.0 10.0
Стабильность 8.8 9.2
Тестов верно
Доля успешных попыток 54.0% 58.7%
Нестабильные тесты 3 2
Всего запусков 63 63
Стоимость за результат 0.130 0.824
Общая стоимость $0.013 $0.075
Цена входа $0.250 / 1M $1.040 / 1M
Цена выхода $1.500 / 1M $6.240 / 1M
Общее число входных токенов 36,973 42,509
Выходные токены 2,487 4,779
Токены рассуждений 0 0
Время ответа (среднее) 1.33s 3.30s
Время ответа (макс.) 4.49s 20.51s
Время ответа (суммарно) 27.91s 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#95 Gemini 3.1 Flash Lite

minimal
Cost
$0.001
Time
3.7s
Tokens
635 tok

#104 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

Быстрое сравнение

Сменить пару сравнения