Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen3.6 Plus Preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Релиз: 2026-04-20 Бесплатно доступно
Оценка 9.6 8.2
Ранг #2 #15
Надежность 10.0 Н/Д
Стабильность 10.0 10.0
Тестов верно
Доля успешных попыток 94.7% 75.0%
Нестабильные тесты 0 0
Всего запусков 57 57
Стоимость за результат 3.300 0.000
Общая стоимость $0.594 $0.000
???? ????? $2.000 / 1M $0.000 / 1M
???? ?????? $12.000 / 1M $0.000 / 1M
Выходные токены 1,944 1,153
Токены рассуждений 41,839 62,197
Время ответа (среднее) 15.15s 15.25s
Время ответа (макс.) 40.61s 43.55s
Время ответа (суммарно) 181.78s 182.96s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 11.69s 61 5,812
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 3.40s 27 1,383
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.52s 27 2,998
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 12 1,297
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0

Быстрое сравнение

Сменить пару сравнения