#45
Arcee AI · Релиз: 2026-01-27 · arcee-ai/trinity-large-preview::none
Нестабильные тесты
1
Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).
Неверный ответ: 9 Не соблюдены инструкции: 2
Графики
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Быстрое сравнение
Trinity Large PreviewnoneБесплатно доступноvsGPT-5.4noneTrinity Large PreviewnoneБесплатно доступноvsKimi K2.5noneTrinity Large PreviewnoneБесплатно доступноvsMiniMax M2.5mediumTrinity Large PreviewnoneБесплатно доступноvsGPT-4o-mininoneTrinity Large PreviewnoneБесплатно доступноvsQwen3.5-35B-A3BnoneTrinity Large PreviewnoneБесплатно доступноvsQwen3 Coder NextnoneTrinity Large PreviewnoneБесплатно доступноvsGemini 3 Flash PreviewmediumTrinity Large PreviewnoneБесплатно доступноvsGemini 3.1 Pro PreviewmediumTrinity Large PreviewnoneБесплатно доступноvsStep 3.5 FlashmediumБесплатно доступно
Разбивка по категориям
| Категория | Средний балл | Стабильность | Тестов верно |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 9.9 | 10.0 | |
| Domain specific | 4.0 | 10.0 | |
| General Intelligence | 3.0 | 9.9 | |
| Instructions following | 3.5 | 6.7 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |