Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique	Inception: Mercury 2 none Sortie: 2026-02-24	OpenAI: GPT-5 Nano medium Sortie: 2025-08-07
Rang	#50	#34
Score moy.	3.4	5.7
Tests corrects
Cohérence	8.9	6.8
Coût par résultat	0.147	0.829
Coût total	$0.006	$0.058
Taux de réussite par tentative	33.3%	64.4%
Tests instables	2	6
common.totalAttempts	45 (15 x 3)	45 (15 x 3)
Jetons de sortie	1,144	4,184
Jetons de raisonnement	0	137,472
Temps de réponse (moy.)	594ms	51.74s
Temps de réponse (max)	1.27s	204.02s
Temps de réponse (total)	8.91s	413.95s

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
OpenAI: GPT-5 Nano	7.0	10.0	66.7%	0		37.73s	1,107	19,968

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	578	17,984

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
OpenAI: GPT-5 Nano	10.0	1.7	50.0%	2		21.42s	453	10,560

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
OpenAI: GPT-5 Nano	4.0	4.4	55.6%	2		204.02s	237	64,448

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
OpenAI: GPT-5 Nano	9.0	6.8	83.3%	1		11.90s	382	4,096

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
OpenAI: GPT-5 Nano	4.0	7.2	44.4%	1		19.81s	869	13,440

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Inception: Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
OpenAI: GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	558	6,976

Comparaison rapide

Changer la paire de comparaison

GPT-5 NanomediumvsGLM 5none Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium DeepSeek V3.2nonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.5-122B-A10Bnone GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none GPT-5 NanomediumvsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Claude Sonnet 4.6nonevsGPT-5 Nanomedium Gemini 3 Flash PreviewnonevsGPT-5 Nanomedium