Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Qwen: Qwen3.6 27B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-28

Метрика Qwen3.5-Flash Qwen3.5-Flash none Релиз: 2026-02-24 Qwen3.6 27B Qwen3.6 27B medium Релиз: 2026-04-20
Оценка 5.9 6.6
Ранг #100 #83
Надежность 10.0 10.0
Стабильность 9.7 8.1
Тестов верно
Доля успешных попыток 41.7% 58.3%
Нестабильные тесты 1 5
Всего запусков 60 60
Стоимость за результат 0.073 3.017
Общая стоимость $0.004 $0.380
Цена входа $0.065 / 1M $0.290 / 1M
Цена выхода $0.260 / 1M $3.200 / 1M
Выходные токены 4,270 12,981
Токены рассуждений 0 105,822
Время ответа (среднее) 3.74s 57.79s
Время ответа (макс.) 27.18s 168.22s
Время ответа (суммарно) 74.71s 1155.83s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 6.8 10.0 50.0% 0 993ms 513 0
Qwen3.6 27B 6.6 10.0 50.0% 0 165.39s 4,760 26,668
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 579 0
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 255 12,044
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 9 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 401 5,807

Быстрое сравнение

Сменить пару сравнения