AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-03
| Метрика | Arcee AI: Trinity Large Preview (free) none Релиз: 2026-01-27 Бесплатно доступно | MoonshotAI: Kimi K2.5 none Релиз: 2026-01-27 |
|---|---|---|
| Ранг | #33 | #35 |
| Средний балл | 4.34 | 4.07 |
| Стабильность | 9.97 | 8.92 |
| Стоимость за результат | 0.000 | 0.232 |
| Общая стоимость | $0.000 | $0.010 |
| Тестов верно | 5/14 | 4/14 |
| Доля успешных попыток | 35.7% | 35.7% |
| Нестабильные тесты | 0 | 2 |
| Выходные токены | 1,415 | 1,915 |
| Токены рассуждений | 0 | 0 |
Разбивка по категориям
| Анти-ИИ уловки | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| Парсинг и извлечение данных | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| Предметно-ориентированное | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| Следование инструкциям | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| Вызов инструментов | Оценка | Стабильность | Доля успешных попыток | Нестабильные тесты | Тестов верно | Выходные токены | Токены рассуждений |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
Быстрое сравнение
Сменить пару сравнения
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneБесплатно доступноvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneБесплатно доступноvsQwen3 Coder NextmediumTrinity Large Preview (free)noneБесплатно доступноvsMiniMax M2.5mediumTrinity Large Preview (free)noneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступноTrinity Large Preview (free)noneБесплатно доступноvsQwen3.5-FlashmediumTrinity Large Preview (free)noneБесплатно доступноvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumБесплатно доступноTrinity Large Preview (free)noneБесплатно доступноvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneБесплатно доступноvsMiMo-V2-Flashmedium