AI BENCHY
Advertise here

#34

Qwen3.5 Plus 2026-04-20

Qwen Релиз: 2026-04-20 Проверено: 2026-05-08 14:34 qwen/qwen3.5-plus-20260420::medium
(medium) (none)

Стабильность

9.1

Общее число выходных токенов

121,204

Цена входа

$0.400 / 1M

Цена выхода

$2.400 / 1M

Тестов верно

Ошибочных тестов: 6

Доля успешных попыток: 73.7%

Нестабильные тесты

2

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

35.96s

Время ответа (макс.): 92.57s

Время ответа (суммарно): 683.23s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-21 23:53 Набор изменён 7.6 9.6 $0.363 Сравнить
2026-05-08 14:34 Набор изменён 7.8 9.6 $0.305 Текущий запуск
2026-05-08 14:34 Набор изменён 7.8 9.6 $0.305 Сравнить
2026-04-27 23:09 Первый запуск 8.2 9.7 $0.269 Сравнить

Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-05-08 14:34 · Набор изменён7.89.19.613/192121,204$0.30535.96s
2026-05-08 14:34 · Набор изменён7.89.19.613/192121,204$0.30535.96s
Разница0.00.00.0000$0.0000ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 10.0 10.0
Программирование 7.6 10.0
Комбинированный 10.0 10.0
Парсинг и извлечение данных 10.0 10.0
Предметно-ориентированное 2.9 7.2
Общий интеллект 4.9 9.6
Следование инструкциям 10.0 10.0
Решение головоломок 8.2 7.2
Вызов инструментов 10.0 10.0
Эрудиция 3.0 10.0

Сравниваемые модели