Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs Qwen: Qwen3.6 35B A3B

Сводка

Сравнение benchmark Qwen3.5-Flash vs Qwen3.6 35B A3B: Qwen3.5-Flash лидирует по среднему баллу: 6.8 vs 6.7. Qwen3.5-Flash имеет более низкую стоимость benchmark: $0.080 vs $0.146. Qwen3.6 35B A3B быстрее: 18.08s vs 63.29s, с долей успешных попыток 71.4% vs 63.5%.

Рекомендуемая модель: Qwen3.6 35B A3B - Его балл близок к лучшему здесь (6.7 против 6.8), и он отвечает примерно в 3.5 раза быстрее, чем Qwen3.5-Flash.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-18

Метрика Qwen3.5-Flash Qwen3.5-Flash medium Релиз: 2026-02-24 Qwen3.6 35B A3B Qwen3.6 35B A3B medium Релиз: 2026-04-20
Оценка 6.8 6.7
Ранг #70 #75
Надежность 10.0 10.0
Стабильность 8.1 9.6
Тестов верно
Доля успешных попыток 71.4% 63.5%
Нестабильные тесты 5 1
Всего запусков 63 63
Стоимость за результат 0.871 1.094
Общая стоимость $0.080 $0.146
Цена входа $0.065 / 1M $0.140 / 1M
Цена выхода $0.260 / 1M $1.000 / 1M
Общее число входных токенов 38,926 16,385
Выходные токены 2,088 19,632
Токены рассуждений 294,598 130,219
Время ответа (среднее) 63.29s 18.08s
Время ответа (макс.) 234.29s 86.11s
Время ответа (суммарно) 1265.85s 343.61s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Qwen3.5-Flash

medium
Стоимость
$0.002
Время
25.8s
Токены
4,294 tok

#75 Qwen3.6 35B A3B

medium
Неверный SVG
Стоимость
$0.000
Время
300.0s
Токены
0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 672 1,154 12,385
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
Qwen3.6 35B A3B 7.7 10.0 66.7% 0 50.55s 5,051 7,929 37,223
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 7,776 2,591 9,968
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 771 6,193 39,116
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 516 129 4,569
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 699 219 7,404
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
Qwen3.6 35B A3B 8.0 10.0 66.7% 0 5.95s 696 655 9,228
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 32.90s 204 762 10,326

Быстрое сравнение

Сменить пару сравнения