Navigation
AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique Inception: Mercury 2 none Sortie: 2026-02-24 OpenAI: GPT-5 Nano medium Sortie: 2025-08-07
Rang #50 #34
Score moy. 3.4 5.7
Tests corrects
Cohérence 8.9 6.8
Coût par résultat 0.147 0.829
Coût total $0.006 $0.058
Taux de réussite par tentative 33.3% 64.4%
Tests instables 2 6
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 1,144 4,184
Jetons de raisonnement 0 137,472
Temps de réponse (moy.) 594ms 51.74s
Temps de réponse (max) 1.27s 204.02s
Temps de réponse (total) 8.91s 413.95s

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
OpenAI: GPT-5 Nano 7.0 10.0 66.7% 0 37.73s 1,107 19,968
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
OpenAI: GPT-5 Nano 10.0 1.7 50.0% 2 21.42s 453 10,560
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
OpenAI: GPT-5 Nano 4.0 4.4 55.6% 2 204.02s 237 64,448
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
OpenAI: GPT-5 Nano 9.0 6.8 83.3% 1 11.90s 382 4,096
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
OpenAI: GPT-5 Nano 4.0 7.2 44.4% 1 19.81s 869 13,440
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

Comparaison rapide

Changer la paire de comparaison