Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.6 Flash vs StepFun: Step 3.7 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-04

Метрика Qwen3.6 Flash Qwen3.6 Flash medium Релиз: 2026-04-20 Step 3.7 Flash Step 3.7 Flash low Релиз: 2026-05-29
Оценка 7.5 7.3
Ранг #39 #57
Надежность 10.0 10.0
Стабильность 8.1 8.4
Тестов верно
Доля успешных попыток 71.4% 68.3%
Нестабильные тесты 5 4
Всего запусков 63 63
Стоимость за результат 3.030 2.840
Общая стоимость $0.288 $0.341
Цена входа $0.188 / 1M $0.200 / 1M
Цена выхода $1.125 / 1M $1.150 / 1M
Общее число входных токенов 42,362 40,101
Выходные токены 2,995 289,325
Токены рассуждений 245,358 0
Время ответа (среднее) 19.25s 15.74s
Время ответа (макс.) 122.87s 124.75s
Время ответа (суммарно) 404.20s 330.63s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

Быстрое сравнение

Сменить пару сравнения