AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#40

Qwen3.5 Plus 2026-04-20

Qwen Релиз: 2026-04-20 Проверено: 2026-05-21 23:53 qwen/qwen3.5-plus-20260420::medium
(medium) (none)

Стабильность

8.7

Общее число выходных токенов

152,508

Цена входа

$0.300 / 1M

Цена выхода

$1.800 / 1M

Тестов верно

Ошибочных тестов: 7

Доля успешных попыток: 71.7%

Нестабильные тесты

3

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

43.65s

Время ответа (макс.): 189.38s

Время ответа (суммарно): 872.90s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-21 23:53 Набор изменён 7.6 9.6 $0.363 Текущий запуск
2026-05-08 14:34 Набор изменён 7.8 9.6 $0.305 Сравнить
2026-05-08 14:34 Набор изменён 7.8 9.6 $0.305 Сравнить
2026-04-27 23:09 Первый запуск 8.2 9.7 $0.269 Сравнить

Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-05-21 23:53 · Текущий запуск7.78.710.013/203152,508$0.36343.65s
2026-05-08 14:34 · Набор изменён7.89.19.613/192121,204$0.30535.96s
Разница-0.1-0.4+0.40+1+31304+$0.058+7686ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 10.0 10.0
Программирование 6.6 6.0
Комбинированный 10.0 10.0
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 2.9 7.2
Общий интеллект 4.9 9.6
Следование инструкциям 10.0 10.0
Решение головоломок 8.2 7.2
Вызов инструментов 10.0 10.0
Эрудиция 3.0 10.0

Сравниваемые модели