Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24
Оценка 9.3 5.8
Ранг #4 #110
Надежность 10.0 10.0
Стабильность 10.0 8.9
Тестов верно
Доля успешных попыток 90.0% 45.0%
Нестабильные тесты 0 3
Всего запусков 60 60
Стоимость за результат 5.587 0.224
Общая стоимость $1.006 $0.016
Цена входа $2.000 / 1M $0.139 / 1M
Цена выхода $12.000 / 1M $1.000 / 1M
Выходные токены 1,971 4,334
Токены рассуждений 75,384 0
Время ответа (среднее) 20.77s 3.50s
Время ответа (макс.) 88.68s 47.43s
Время ответа (суммарно) 269.96s 70.00s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 574 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.0 9.8 50.0% 0 54.28s 429 37,735
Qwen3.5-35B-A3B 6.8 10.0 50.0% 0 1.72s 562 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 1,833 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 114 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 63 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 235 3,128
Qwen3.5-35B-A3B 3.7 7.4 22.2% 1 1.35s 655 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 12 1,297
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 493ms 11 0

Быстрое сравнение

Сменить пару сравнения