Navigation
AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs MiniMax: MiniMax M2.5

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique Inception: Mercury 2 none Sortie: 2026-02-24 MiniMax: MiniMax M2.5 medium Sortie: 2026-02-12
Rang #50 #42
Score moy. 3.4 4.8
Tests corrects
Cohérence 8.9 5.8
Coût par résultat 0.147 4.937
Coût total $0.006 $0.247
Taux de réussite par tentative 33.3% 62.2%
Tests instables 2 8
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 1,144 107,019
Jetons de raisonnement 0 204,504
Temps de réponse (moy.) 594ms 47.58s
Temps de réponse (max) 1.27s 237.27s
Temps de réponse (total) 8.91s 380.62s

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
MiniMax: MiniMax M2.5 9.3 7.9 88.9% 1 32.42s 286 45,112
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
MiniMax: MiniMax M2.5 10.0 2.1 66.7% 1 60.39s 740 9,713
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
MiniMax: MiniMax M2.5 10.0 1.7 66.7% 2 7.48s 266 3,835
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
MiniMax: MiniMax M2.5 10.0 4.4 22.2% 2 237.27s 105,047 133,487
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
MiniMax: MiniMax M2.5 8.0 6.8 83.3% 1 4.64s 252 1,873
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
MiniMax: MiniMax M2.5 4.0 7.2 44.4% 1 11.54s 159 9,547
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
MiniMax: MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937

Comparaison rapide

Changer la paire de comparaison