AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI · Sortie: 2026-01-27 · arcee-ai/trinity-large-preview::none

Coût par résultat

0.000

Cohérence

9.6

Coût total

$0.000

Tests corrects

Tests incorrects: 11

Taux de réussite par tentative: 33.3%

Tests instables

1

Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).

Temps de réponse (moy.)

3.15s

Temps de réponse (max): 8.91s

Temps de réponse (total): 50.46s

Mauvaise réponse: 9 N'a pas suivi les instructions: 2

Graphiques

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Comparaison rapide

Répartition par catégorie

Catégorie Score moy. Cohérence Tests corrects
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0