Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3.5-122B-A10B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview medium Релиз: 2025-12-17 Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24
Оценка 9.8 5.4
Ранг #1 #131
Надежность 10.0 10.0
Стабильность 9.6 9.5
Тестов верно
Доля успешных попыток 98.3% 33.3%
Нестабильные тесты 1 1
Всего запусков 60 60
Стоимость за результат 2.980 0.380
Общая стоимость $0.567 $0.019
Цена входа $0.500 / 1M $0.260 / 1M
Цена выхода $3.000 / 1M $2.080 / 1M
Выходные токены 2,000 3,374
Токены рассуждений 181,033 0
Время ответа (среднее) 16.50s 3.38s
Время ответа (макс.) 117.26s 46.00s
Время ответа (суммарно) 330.06s 67.55s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 312 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 456 127,964
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 684 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 1,137 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 183 4,365
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 575 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 9 0

Быстрое сравнение

Сменить пару сравнения