Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-35B-A3B

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Qwen: Qwen3.5-35B-A3B none Релиз: 2026-02-24
Ранг	#45	#42
Средний балл	4.2	4.7
Стабильность	9.6	8.6
Стоимость за результат	0.000	0.237
Общая стоимость	$0.000	$0.015
Тестов верно
Доля успешных попыток	33.3%	50.0%
Нестабильные тесты	1	3
Всего запусков	48 (16 x 3)	48 (16 x 3)
Выходные токены	1,837	3,756
Токены рассуждений	0	0
Время ответа (среднее)	3.15s	4.10s
Время ответа (макс.)	8.91s	47.43s
Время ответа (суммарно)	50.46s	65.62s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Qwen: Qwen3.5-35B-A3B	10.0	7.2	22.2%	1		1.76s	569	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	0.0%	0		47.43s	1,833	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Qwen: Qwen3.5-35B-A3B	9.9	10.0	100.0%	0		1.16s	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Qwen: Qwen3.5-35B-A3B	7.0	10.0	66.7%	0		485ms	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Qwen: Qwen3.5-35B-A3B	6.0	3.4	66.7%	1		1.19s	114	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Qwen: Qwen3.5-35B-A3B	5.0	10.0	50.0%	0		809ms	63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Qwen: Qwen3.5-35B-A3B	1.7	7.4	22.2%	1		1.34s	655	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	264	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5medium Mercury 2mediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Trinity Large PreviewnoneБесплатно доступноvsMercury 2medium Trinity Large PreviewnoneБесплатно доступноvsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneБесплатно доступноvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneБесплатно доступноvsGPT-5 Nanomedium