Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика Gemini 3.5 Flash Gemini 3.5 Flash low Релиз: 2026-05-19 Qwen3.5-9B Qwen3.5-9B none Релиз: 2026-03-02
Оценка 9.3 4.6
Ранг #3 #142
Надежность 10.0 10.0
Стабильность 10.0 9.7
Тестов верно
Доля успешных попыток 90.0% 21.7%
Нестабильные тесты 0 1
Всего запусков 60 60
Стоимость за результат 1.582 0.120
Общая стоимость $0.285 $0.005
???? ????? $1.500 / 1M $0.040 / 1M
???? ?????? $9.000 / 1M $0.150 / 1M
Выходные токены 2,027 3,984
Токены рассуждений 23,938 0
Время ответа (среднее) 2.98s 1.69s
Время ответа (макс.) 6.44s 5.91s
Время ответа (суммарно) 59.59s 33.84s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 452 6,839
Qwen3.5-9B 4.4 6.7 16.7% 1 5.39s 1,033 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
Qwen3.5-9B 3.1 10.0 0.0% 0 683ms 388 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690
Qwen3.5-9B 3.0 10.0 0.0% 0 2.32s 6 0

Быстрое сравнение

Сменить пару сравнения