Comparer Graphiques Méthodologie

Langue:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.4

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique	ByteDance Seed: Seed-2.0-Mini medium Sortie: 2026-02-14	OpenAI: GPT-5.4 none Sortie: 2026-03-05
Score moy.	7.0	4.6
Rang	#24	#45
Tests corrects
Cohérence	9.4	8.9
Coût par résultat	0.261	1.496
Coût total	$0.027	$0.090
Taux de réussite par tentative	71.1%	44.4%
Tests instables	1	2
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Jetons de sortie	1,752	1,635
Jetons de raisonnement	54,246	0
Temps de réponse (moy.)	67.46s	1.46s
Temps de réponse (max)	262.83s	2.89s
Temps de réponse (total)	809.49s	21.86s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
OpenAI: GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
OpenAI: GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
OpenAI: GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
OpenAI: GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
OpenAI: GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
OpenAI: GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
OpenAI: GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0

Comparaison rapide

Changer la paire de comparaison

Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6nonevsSeed-2.0-Minimedium MiniMax M2.5mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsQwen3.5 Plus 2026-02-15none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-MinimediumvsGPT-5.2 Chatnone Mercury 2mediumvsGPT-5.4none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewhigh Seed-2.0-MinimediumvsGemini 3 Flash Previewlow Seed-2.0-MinimediumvsGLM 5none