Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-15

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24
Ранг #21 #33
Оценка 7.9 7.1
Стабильность 10.0 6.3
Стоимость за результат 0.177 4.251
Общая стоимость $0.020 $0.341
Тестов верно
Доля успешных попыток 68.8% 77.1%
Нестабильные тесты 0 7
Всего запусков 48 48
Выходные токены 1,611 5,495
Токены рассуждений 7,272 169,266
Время ответа (среднее) 3.36s 43.93s
Время ответа (макс.) 11.91s 106.00s
Время ответа (суммарно) 53.84s 702.85s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 2.18s 456 1,224
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.75s 429 36,235
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

Быстрое сравнение

Сменить пару сравнения