Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-14

Метрика Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Релиз: 2026-02-19 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Релиз: 2026-02-24
Оценка 9.6 7.4
Ранг #2 #40
Стабильность 10.0 6.7
Тестов верно
Доля успешных попыток 94.4% 79.6%
Нестабильные тесты 0 7
Всего запусков 54 54
Стоимость за результат 3.400 3.976
Общая стоимость $0.578 $0.398
???? ????? $2.000 / 1M $0.163 / 1M
???? ?????? $12.000 / 1M $1.300 / 1M
Выходные токены 1,932 10,137
Токены рассуждений 40,542 208,761
Время ответа (среднее) 15.96s 44.51s
Время ответа (макс.) 40.61s 106.00s
Время ответа (суммарно) 175.52s 801.21s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.13s 798 42,652
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 79.09s 4,273 33,078
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

Быстрое сравнение

Сменить пару сравнения