Сравнить Графики

Язык:

❤️ Made by XCS

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-03

Метрика	Arcee AI: Trinity Large Preview (free) none Релиз: 2026-01-27 Бесплатно доступно	MoonshotAI: Kimi K2.5 none Релиз: 2026-01-27
Ранг	#33	#35
Средний балл	4.34	4.07
Стабильность	9.97	8.92
Стоимость за результат	0.000	0.232
Общая стоимость	$0.000	$0.010
Тестов верно	5/14	4/14
Доля успешных попыток	35.7%	35.7%
Нестабильные тесты	0	2
Выходные токены	1,415	1,915
Токены рассуждений	0	0

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	1.00	10.00	0.0%	0		587	0
MoonshotAI: Kimi K2.5	2.67	7.86	11.1%	1		363	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	9.88	10.00	100.0%	0		186	0
MoonshotAI: Kimi K2.5	5.50	5.81	83.3%	1		995	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	4.00	10.00	33.3%	0		21	0
MoonshotAI: Kimi K2.5	4.00	10.00	33.3%	0		29	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	2.00	9.79	0.0%	0		63	0
MoonshotAI: Kimi K2.5	5.00	9.99	50.0%	0		61	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	4.00	9.99	33.3%	0		291	0
MoonshotAI: Kimi K2.5	2.00	9.92	0.0%	0		247	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Выходные токены	Токены рассуждений
Arcee AI: Trinity Large Preview (free)	10.00	10.00	100.0%	0		267	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		220	0

Быстрое сравнение

Сменить пару сравнения

Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Preview (free)noneБесплатно доступноvsGLM 4.7 Flashmedium Kimi K2.5nonevsQwen3 Coder Nextmedium Trinity Large Preview (free)noneБесплатно доступноvsQwen3 Coder Nextmedium Trinity Large Preview (free)noneБесплатно доступноvsMiniMax M2.5medium Trinity Large Preview (free)noneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно Trinity Large Preview (free)noneБесплатно доступноvsQwen3.5-Flashmedium Trinity Large Preview (free)noneБесплатно доступноvsGPT-5 Nanomedium MiniMax M2.5mediumvsKimi K2.5none Kimi K2.5nonevsgpt-oss-120bmediumБесплатно доступно Trinity Large Preview (free)noneБесплатно доступноvsQwen3.5-35B-A3Bmedium Trinity Large Preview (free)noneБесплатно доступноvsMiMo-V2-Flashmedium