AI BENCHY Compare

Inception: Mercury 2 vs Laguna M.1

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-29

Métrique	Mercury 2 Mercury 2 medium Sortie: 2026-02-24	Laguna M.1 Laguna M.1 medium Sortie: 2026-04-28 Disponible gratuitement

Métrique	Mercury 2 Mercury 2 medium Sortie: 2026-02-24	Laguna M.1 Laguna M.1 medium Sortie: 2026-04-28 Disponible gratuitement
Score	6.5	6.3
Rang	#71	#74
Fiabilité	N/D	10.0
Cohérence	8.6	8.6
Tests corrects
Taux de réussite par tentative	53.7%	53.7%
Tests instables	3	3
Exécutions totales	54	54
Coût par résultat	0.580	0.000
Coût total	$0.047	$0.000
Prix d'entrée	$0.250 / 1M	$0.000 / 1M
Prix de sortie	$0.750 / 1M	$0.000 / 1M
Jetons de sortie	3,972	63,822
Jetons de raisonnement	48,333	0
Temps de réponse (moy.)	2.21s	13.90s
Temps de réponse (max)	14.63s	53.14s
Temps de réponse (total)	37.51s	250.28s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	6.9	9.9	50.0%	0		1.12s	2,546	2,609
Laguna M.1	6.6	10.0	50.0%	0		9.15s	7,839	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	10.0	10.0	100.0%	0		1.53s	249	2,213
Laguna M.1	4.3	1.1	66.7%	1		35.61s	14,327	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	10.0	10.0	100.0%	0		3.28s	268	4,887
Laguna M.1	3.0	10.0	0.0%	0		53.14s	12,272	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	7.3	5.9	83.3%	1		1.11s	183	1,656
Laguna M.1	10.0	10.0	100.0%	0		4.93s	2,296	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	2.9	7.2	11.1%	1		6.48s	41	30,754
Laguna M.1	5.3	7.2	44.4%	1		24.14s	19,020	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	4.8	10.0	0.0%	0		821ms	137	542
Laguna M.1	4.1	10.0	0.0%	0		6.86s	1,294	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	10.0	10.0	100.0%	0		1.07s	14	958
Laguna M.1	10.0	10.0	100.0%	0		4.30s	1,626	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	3.9	7.5	22.2%	1		934ms	354	2,758
Laguna M.1	3.6	7.2	22.2%	1		6.97s	3,978	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Mercury 2	10.0	10.0	100.0%	0		1.89s	180	1,956
Laguna M.1	10.0	10.0	100.0%	0		6.31s	1,170	0

Comparaison rapide

Changer la paire de comparaison

Mercury 2mediumvsMiMo-V2-Omninone Laguna M.1mediumDisponible gratuitementvsMiMo-V2-Omninone Laguna M.1mediumDisponible gratuitementvsGLM 5V Turbonone Laguna M.1mediumDisponible gratuitementvsQwen3.5-Flashnone Mercury 2mediumvsGLM 5none Gemma 4 26B A4BnoneDisponible gratuitementvsLaguna M.1mediumDisponible gratuitement Seed-2.0-LitenonevsLaguna M.1mediumDisponible gratuitement DeepSeek V4 PrononevsMercury 2medium Gemini 2.5 FlashnonevsLaguna M.1mediumDisponible gratuitement Laguna M.1mediumDisponible gratuitementvsQwen3.5-35B-A3Bnone Mercury 2mediumvsGPT-5.5none Mercury 2mediumvsQwen3.5 Plus 2026-02-15none