AI BENCHY
Compară Grafice Metodologie
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI · Lansare: 2026-01-27 · arcee-ai/trinity-large-preview::none

Cost per rezultat

0.000

Consistență

9.6

Cost total

$0.000

Teste corecte

Teste greșite: 11

Rată de trecere pe încercare: 33.3%

Teste instabile

1

Testele instabile au avut rezultate mixte între rulări (cel puțin un succes și un eșec).

Timp de răspuns (mediu)

3.15s

Timp de răspuns (maxim): 8.91s

Timp de răspuns (total): 50.46s

Răspuns greșit: 9 Nu a urmat instrucțiunile: 2

Grafice

Alege primul model, apoi fă clic pe al doilea model pentru a deschide o pagină alăturată.

Comparație rapidă

Defalcare pe categorii

Categorie Scor mediu Consistență Teste corecte
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0