AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Ранг	#53	#66
Средний балл	4.2	2.6
Стабильность	9.6	7.4
Стоимость за результат	0.000	0.779
Общая стоимость	$0.000	$0.024
Тестов верно
Доля успешных попыток	33.3%	35.4%
Нестабильные тесты	1	5
Всего запусков	48	48
Выходные токены	1,837	17,930
Токены рассуждений	0	139,706
Время ответа (среднее)	3.15s	71.44s
Время ответа (макс.)	8.91s	226.38s
Время ответа (суммарно)	50.46s	928.77s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Qwen3.5-9B	4.0	7.2	55.6%	1		31.54s	2,410	10,913

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Qwen3.5-9B	10.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Qwen3.5-9B	5.0	5.6	33.3%	1		87.31s	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Qwen3.5-9B	10.0	7.2	22.2%	1		137.75s	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Qwen3.5-9B	10.0	1.6	33.3%	1		226.38s	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Qwen3.5-9B	5.5	5.8	66.7%	1		17.15s	599	4,517

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Qwen3.5-9B	10.0	10.0	0.0%	0		33.38s	1,545	11,844

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149

Быстрое сравнение

Сменить пару сравнения

Qwen3.5-9BmediumvsMiMo-V2-Flashnone Qwen3.5-9BmediumvsGrok 4.1 Fastnone Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5medium Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium Trinity Large PreviewnoneБесплатно доступноvsGrok 4.20 Multi-Agent Betamedium Mercury 2nonevsQwen3.5-9Bmedium Nemotron 3 Super 120b A12bnoneБесплатно доступноvsQwen3.5-9Bmedium Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Trinity Large PreviewnoneБесплатно доступноvsMercury 2medium Trinity Large PreviewnoneБесплатно доступноvsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsGLM 4.7 Flashnone Trinity Large PreviewnoneБесплатно доступноvsQwen3.5-35B-A3Bmedium