Сравнить Графики Методология

Язык:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-06

Метрика	Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Z.ai: GLM 4.7 Flash medium Релиз: 2026-01-19
Ранг	#45	#52
Средний балл	4.2	3.1
Стабильность	9.6	6.4
Стоимость за результат	0.000	1.040
Общая стоимость	$0.000	$0.042
Тестов верно
Доля успешных попыток	33.3%	41.7%
Нестабильные тесты	1	7
Всего запусков	48	48
Выходные токены	1,837	38,682
Токены рассуждений	0	64,952
Время ответа (среднее)	3.15s	36.84s
Время ответа (макс.)	8.91s	174.55s
Время ответа (суммарно)	50.46s	331.58s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Z.ai: GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Z.ai: GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Z.ai: GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Z.ai: GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Z.ai: GLM 4.7 Flash	10.0	9.7	0.0%	0		18.14s	18	2,138

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Z.ai: GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Z.ai: GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Z.ai: GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

Быстрое сравнение

Сменить пару сравнения

Grok 4.1 FastnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5medium LFM2-24B-A2BnonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large PreviewnoneБесплатно доступноvsMercury 2medium Trinity Large PreviewnoneБесплатно доступноvsQwen3.5-35B-A3Bmedium