AI BENCHY Compare

Hunter Alpha vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика	Hunter Alpha Hunter Alpha none Релиз: Дата релиза неизвестна	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Hunter Alpha Hunter Alpha none Релиз: Дата релиза неизвестна	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Ранг	#50	#66
Средний балл	4.6	2.6
Стабильность	8.0	7.4
Стоимость за результат	0.000	0.779
Общая стоимость	$0.000	$0.024
Тестов верно
Доля успешных попыток	52.1%	35.4%
Нестабильные тесты	4	5
Всего запусков	48	48
Выходные токены	2,272	17,930
Токены рассуждений	0	139,706
Время ответа (среднее)	4.64s	71.44s
Время ответа (макс.)	15.17s	226.38s
Время ответа (суммарно)	74.24s	928.77s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	1.3	7.4	22.2%	1		3.85s	773	0
Qwen3.5-9B	4.0	7.2	55.6%	1		31.54s	2,410	10,913

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	0.0%	0		15.17s	379	0
Qwen3.5-9B	10.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	9.9	10.0	100.0%	0		8.49s	249	0
Qwen3.5-9B	5.0	5.6	33.3%	1		87.31s	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	4.0	10.0	33.3%	0		2.33s	27	0
Qwen3.5-9B	10.0	7.2	22.2%	1		137.75s	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	5.0	3.1	66.7%	1		2.71s	91	0
Qwen3.5-9B	10.0	1.6	33.3%	1		226.38s	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	5.0	10.0	50.0%	0		2.82s	69	0
Qwen3.5-9B	5.5	5.8	66.7%	1		17.15s	599	4,517

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	4.0	4.4	66.7%	2		3.06s	349	0
Qwen3.5-9B	10.0	10.0	0.0%	0		33.38s	1,545	11,844

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumvsHunter Alphanone Qwen3.5-9BmediumvsMiMo-V2-Flashnone Qwen3.5-9BmediumvsGrok 4.1 Fastnone Hunter AlphanonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumБесплатно доступноvsHunter Alphanone Mercury 2mediumvsHunter Alphanone Mercury 2nonevsQwen3.5-9Bmedium Nemotron 3 Super 120b A12bnoneБесплатно доступноvsQwen3.5-9Bmedium Hunter AlphanonevsQwen3.5-35B-A3Bmedium GPT-5 NanomediumvsHunter Alphanone Hunter AlphanonevsQwen3 Coder Nextmedium Nemotron 3 Super 120b A12bmediumБесплатно доступноvsHunter Alphanone