Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5-35B-A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Релиз: 2026-02-24 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24
Оценка 5.4 5.8
Ранг #131 #110
Надежность 10.0 10.0
Стабильность 9.5 8.9
Тестов верно
Доля успешных попыток 33.3% 45.0%
Нестабильные тесты 1 3
Всего запусков 60 60
Стоимость за результат 0.380 0.224
Общая стоимость $0.019 $0.011
Цена входа $0.260 / 1M $0.140 / 1M
Цена выхода $2.080 / 1M $1.000 / 1M
Выходные токены 3,374 4,334
Токены рассуждений 0 0
Время ответа (среднее) 3.38s 3.50s
Время ответа (макс.) 46.00s 47.43s
Время ответа (суммарно) 67.55s 70.00s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 312 0
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 574 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 684 0
Qwen3.5-35B-A3B 6.8 10.0 50.0% 0 1.72s 562 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 1,137 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 1,833 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 243 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 15 0
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 15 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 114 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 69 0
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 63 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 575 0
Qwen3.5-35B-A3B 3.7 7.4 22.2% 1 1.35s 655 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 9 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 493ms 11 0

Быстрое сравнение

Сменить пару сравнения