Navigare
AI BENCHY
Compară Grafice
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs Inception: Mercury 2

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-05

Metrică Arcee AI: Trinity Large Preview (free) none Lansare: 2026-01-27 Disponibil gratuit Inception: Mercury 2 medium Lansare: 2026-02-24
Rang #45 #35
Scor mediu 43 54
Consistență 96 83
Cost per rezultat 0.000 0.622
Cost total $0.000 $0.044
Timp de răspuns (medie) 3.17s 2.47s
Timp de răspuns (maxim) 8.91s 14.63s
Timp de răspuns (total) 47.61s 34.56s
Teste corecte
Rată de trecere pe încercare 35.6% 57.8%
Teste instabile 1 3
Tokenuri de ieșire 1,713 3,571
Tokenuri de raționament 0 45,379

Top modele după scor

Timp de răspuns (medie)

Scor vs cost total

Scor mediu vs Timp de răspuns (medie)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 100 100 0.0% 0 3.59s 587 0
Inception: Mercury 2 73 98 66.7% 0 1.30s 2,531 2,410
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 100 100 0.0% 0 8.91s 294 0
Inception: Mercury 2 100 100 100.0% 0 3.28s 268 4,887
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 99 100 100.0% 0 3.26s 186 0
Inception: Mercury 2 55 59 83.3% 1 1.11s 183 1,656
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 40 100 33.3% 0 877ms 25 0
Inception: Mercury 2 100 72 11.1% 1 6.48s 41 30,754
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 35 67 16.7% 1 1.09s 63 0
Inception: Mercury 2 100 100 100.0% 0 1.07s 14 958
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 40 100 33.3% 0 3.30s 291 0
Inception: Mercury 2 17 75 22.2% 1 934ms 354 2,758
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (medie) Tokenuri de ieșire Tokenuri de raționament
Arcee AI: Trinity Large Preview (free) 100 100 100.0% 0 6.67s 267 0
Inception: Mercury 2 100 100 100.0% 0 1.89s 180 1,956

Comparație rapidă

Schimbă perechea de comparație