AI BENCHY Compare

Trinity Large Preview vs MoonshotAI: Kimi K2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-16

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	Kimi K2.5 Kimi K2.5 none Релиз: 2026-01-27
Оценка	5.3	5.5
Ранг	#76	#74
Стабильность	9.6	8.7
Тестов верно
Доля успешных попыток	29.6%	40.7%
Нестабильные тесты	1	3
Всего запусков	52	54
Стоимость за результат	0.000	0.271
Общая стоимость	$0.000	$0.017
???? ?????	$0.000 / 1M	$0.383 / 1M
???? ??????	$0.000 / 1M	$1.720 / 1M
Выходные токены	1,985	2,659
Токены рассуждений	0	0
Время ответа (среднее)	5.07s	13.37s
Время ответа (макс.)	39.47s	42.13s
Время ответа (суммарно)	91.23s	147.05s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	373	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
Kimi K2.5	10.0	10.0	100.0%	0		38.78s	649	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
Kimi K2.5	2.8	2.1	33.3%	1		19.16s	748	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	187	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	29	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	76	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	60	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
Kimi K2.5	3.1	10.0	0.0%	0		4.73s	317	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	220	0

Быстрое сравнение

Сменить пару сравнения

Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.7medium Trinity Large PreviewnoneБесплатно доступноvsElephantmedium Mistral Small 4mediumvsKimi K2.5none MiniMax M2.5mediumБесплатно доступноvsKimi K2.5none MiniMax M2.7mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumБесплатно доступно Kimi K2.5nonevsElephantmedium Trinity Large PreviewnoneБесплатно доступноvsMistral Small 4medium Trinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5mediumБесплатно доступно Trinity Large PreviewnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium Kimi K2.5nonevsGPT-5 Nanomedium