Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.5 Flash vs Qwen: Qwen3.5-122B-A10B

Сводка

Сравнение benchmark Gemini 3.5 Flash vs Qwen3.5-122B-A10B: Qwen3.5-122B-A10B лидирует по среднему баллу: 7.7 vs 7.0. Qwen3.5-122B-A10B имеет более низкую стоимость benchmark: $0.588 vs $1.079. Gemini 3.5 Flash быстрее: 9.93s vs 42.49s, с долей успешных попыток 77.8% vs 73.0%.

Рекомендуемая модель: Qwen3.5-122B-A10B - Здесь у него лучший балл (7.7), при этом он примерно в 1.8 раза дешевле, чем Gemini 3.5 Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Gemini 3.5 Flash Gemini 3.5 Flash none Релиз: 2026-05-19 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Релиз: 2026-02-24
Оценка 7.0 7.7
Ранг #66 #39
Надежность 10.0 10.0
Стабильность 8.9 8.8
Тестов верно
Доля успешных попыток 77.8% 73.0%
Нестабильные тесты 3 3
Всего запусков 63 63
Стоимость за результат 7.190 5.235
Общая стоимость $1.079 $0.588
Цена входа $1.500 / 1M $0.260 / 1M
Цена выхода $9.000 / 1M $2.080 / 1M
Общее число входных токенов 13,843 41,832
Выходные токены 117,518 26,187
Токены рассуждений 0 251,028
Время ответа (среднее) 9.93s 42.49s
Время ответа (макс.) 64.36s 168.16s
Время ответа (суммарно) 178.68s 892.30s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#66 Gemini 3.5 Flash

none
Cost
$0.225
Time
125.5s
Tokens
25,004 tok

#39 Qwen3.5-122B-A10B

medium
Cost
$0.019
Time
48.7s
Tokens
6,034 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 672 269 16,835
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
Qwen3.5-122B-A10B 6.0 7.2 55.6% 1 114.48s 7,630 8,057 82,578
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 14,947 483 11,337
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 7,782 270 16,558
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 771 15,537 64,889
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 344 66 7,592
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 593 77 7,372
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 696 284 27,575
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 8,193 322 1,226
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 204 822 15,066

Быстрое сравнение

Сменить пару сравнения