Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Flash vs StepFun: Step 3.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика Qwen3.6 Flash Qwen3.6 Flash medium Релиз: 2026-04-20 Step 3.5 Flash Step 3.5 Flash medium Релиз: 2026-02-01
Оценка 7.6 7.4
Ранг #46 #61
Надежность 10.0 10.0
Стабильность 8.4 9.1
Тестов верно
Доля успешных попыток 71.7% 62.3%
Нестабильные тесты 4 2
Всего запусков 60 57
Стоимость за результат 2.898 0.133
Общая стоимость $0.348 $0.015
Цена входа $0.188 / 1M $0.090 / 1M
Цена выхода $1.125 / 1M $0.300 / 1M
Выходные токены 2,974 90,478
Токены рассуждений 231,797 173,544
Время ответа (среднее) 18.97s 43.20s
Время ответа (макс.) 122.87s 170.45s
Время ответа (суммарно) 379.49s 561.54s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 624 14,024
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 5.1 6.8 33.3% 1 51.92s 474 54,406
Step 3.5 Flash 3.5 6.0 50.0% 1 62.83s 12,098 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 483 13,839
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 270 13,155
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 60 24,409
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 140 5,445
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 102 7,423
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 2,364 3,521
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 460 10,860
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 5,630 10,861
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 335 1,188
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 26 87,048
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

Быстрое сравнение

Сменить пару сравнения