AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Inception: Mercury 2

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-16

Métrique	DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01	Mercury 2 Mercury 2 medium Sortie: 2026-02-24

Métrique	DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01	Mercury 2 Mercury 2 medium Sortie: 2026-02-24
Score	6.1	6.5
Rang	#63	#53
Cohérence	8.1	8.6
Tests corrects
Taux de réussite par tentative	50.0%	53.7%
Tests instables	4	3
Exécutions totales	54	54
Coût par résultat	0.226	0.580
Coût total	$0.016	$0.047
Prix d'entrée	$0.260 / 1M	$0.250 / 1M
Prix de sortie	$0.380 / 1M	$0.750 / 1M
Jetons de sortie	8,384	3,972
Jetons de raisonnement	0	48,333
Temps de réponse (moy.)	12.09s	2.21s
Temps de réponse (max)	115.89s	14.63s
Temps de réponse (total)	217.56s	37.51s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	3.2	9.8	0.0%	0		7.63s	1,419	0
Mercury 2	6.9	9.9	50.0%	0		1.12s	2,546	2,609

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	2.4	1.3	33.3%	1		7.63s	553	0
Mercury 2	10.0	10.0	100.0%	0		1.53s	249	2,213

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Mercury 2	10.0	10.0	100.0%	0		3.28s	268	4,887

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Mercury 2	7.3	5.9	83.3%	1		1.11s	183	1,656

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	3.6	7.2	22.2%	1		1.61s	24	0
Mercury 2	2.9	7.2	11.1%	1		6.48s	41	30,754

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		2.86s	67	0
Mercury 2	4.8	10.0	0.0%	0		821ms	137	542

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Mercury 2	10.0	10.0	100.0%	0		1.07s	14	958

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	8.5	7.5	88.9%	1		7.37s	1,136	0
Mercury 2	3.9	7.5	22.2%	1		934ms	354	2,758

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Mercury 2	10.0	10.0	100.0%	0		1.89s	180	1,956

Comparaison rapide

Changer la paire de comparaison

Mercury 2mediumvsMiMo-V2-Omninone DeepSeek V3.2nonevsGPT-5 Nanomedium Mercury 2mediumvsGLM 5none Mercury 2mediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsgpt-oss-120bmediumDisponible gratuitement Mercury 2mediumvsGLM 5V Turbonone Mercury 2mediumvsQwen3.5-Flashnone Gemma 4 26B A4BnoneDisponible gratuitementvsMercury 2medium Seed-2.0-LitenonevsMercury 2medium Gemini 2.5 FlashnonevsMercury 2medium Mercury 2mediumvsQwen3.5-35B-A3Bnone Gemma 4 31BnoneDisponible gratuitementvsMercury 2medium