#45
Arcee AI · Lansare: 2026-01-27 · arcee-ai/trinity-large-preview::none
Teste instabile
1
Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).
Răspuns greșit: 9 Nu a urmat instrucțiunile: 2
Grafice
Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.
Comparație rapidă
Trinity Large PreviewnoneDisponibil gratuitvsGPT-5.4noneTrinity Large PreviewnoneDisponibil gratuitvsKimi K2.5noneTrinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.5mediumTrinity Large PreviewnoneDisponibil gratuitvsGPT-4o-mininoneTrinity Large PreviewnoneDisponibil gratuitvsQwen3.5-35B-A3BnoneTrinity Large PreviewnoneDisponibil gratuitvsQwen3 Coder NextnoneTrinity Large PreviewnoneDisponibil gratuitvsGemini 3 Flash PreviewmediumTrinity Large PreviewnoneDisponibil gratuitvsGemini 3.1 Pro PreviewmediumTrinity Large PreviewnoneDisponibil gratuitvsStep 3.5 FlashmediumDisponibil gratuit
Defalcare pe categorii
| Categorie | Scor mediu | Consistență | Teste corecte |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 9.9 | 10.0 | |
| Domain specific | 4.0 | 10.0 | |
| General Intelligence | 3.0 | 9.9 | |
| Instructions following | 3.5 | 6.7 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |