Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3 Coder Next

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Qwen: Qwen3 Coder Next none Релиз: 2026-02-03
Ранг	#45	#48
Средний балл	4.2	4.0
Стабильность	9.6	10.0
Стоимость за результат	0.000	0.174
Общая стоимость	$0.000	$0.007
Тестов верно
Доля успешных попыток	33.3%	25.0%
Нестабильные тесты	1	0
Всего запусков	48 (16 x 3)	48 (16 x 3)
Выходные токены	1,837	3,026
Токены рассуждений	0	0
Время ответа (среднее)	3.15s	11.68s
Время ответа (макс.)	8.91s	45.14s
Время ответа (суммарно)	50.46s	116.76s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Qwen: Qwen3 Coder Next	2.3	10.0	0.0%	0		4.39s	1,315	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Qwen: Qwen3 Coder Next	10.0	10.0	0.0%	0		45.14s	317	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Qwen: Qwen3 Coder Next	5.4	10.0	50.0%	0		1.32s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Qwen: Qwen3 Coder Next	4.0	10.0	33.3%	0		962ms	26	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Qwen: Qwen3 Coder Next	4.5	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Qwen: Qwen3 Coder Next	1.3	10.0	0.0%	0		22.86s	652	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen: Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Быстрое сравнение

Сменить пару сравнения

Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5medium MiniMax M2.5mediumvsQwen3 Coder Nextnone Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneБесплатно доступноvsMercury 2medium gpt-oss-120bmediumБесплатно доступноvsQwen3 Coder Nextnone Trinity Large PreviewnoneБесплатно доступноvsGLM 4.7 Flashmedium Trinity Large PreviewnoneБесплатно доступноvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneБесплатно доступноvsGPT-5 Nanomedium Mercury 2mediumvsQwen3 Coder Nextnone GPT-5 NanomediumvsQwen3 Coder Nextnone