AI BENCHY
Advertise here

#51

Qwen3.5-Flash

Qwen Релиз: 2026-02-24 Проверено: 2026-05-21 23:57 qwen/qwen3.5-flash-02-23::medium
(medium) (none)

Стабильность

8.0

Общее число выходных токенов

274,137

Цена входа

$0.065 / 1M

Цена выхода

$0.260 / 1M

Тестов верно

Ошибочных тестов: 8

Доля успешных попыток: 75.0%

Нестабильные тесты

5

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

63.04s

Время ответа (макс.): 234.29s

Время ответа (суммарно): 1197.71s

История запусков

Проверено Оценка Надежность Тестов верно Общая стоимость Сравнить
2026-05-21 23:57 Набор изменён 7.4 8.3 $0.104 Текущий запуск
2026-04-11 01:44 Первый зафиксированный запуск 7.8 Н/Д $0.080 Сравнить

Этот запуск использовал другой набор бенчмарков. Учитывайте изменения набора при чтении исторической динамики.

Сравнение запусков

ЗапускОценкаСтабильностьНадежностьТестов верноНестабильные тестыОбщее число выходных токеновОбщая стоимостьВремя ответа (среднее)
2026-05-21 23:57 · Текущий запуск7.68.010.012/205274,137$0.09963.04s
2026-04-11 01:44 · Первый зафиксированный запуск7.87.3Н/Д11/186193,972$0.08066.72s
Разница-0.2+0.7+1-1+80165+$0.020-3686ms

Эти два запуска использовали разные наборы бенчмарков, поэтому различия отражают и изменения модели, и изменения набора.

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Быстрое сравнение

Разбивка по категориям

Категория Оценка Стабильность Тестов верно
Анти-ИИ уловки 10.0 10.0
Программирование 4.1 5.8
Комбинированный 10.0 10.0
Парсинг и извлечение данных 7.3 5.9
Предметно-ориентированное 5.3 7.2
Общий интеллект 6.1 3.1
Следование инструкциям 10.0 10.0
Решение головоломок 8.2 7.2
Вызов инструментов 10.0 10.0
Эрудиция 3.0 10.0

Сравниваемые модели