Comparer Graphiques Méthodologie

Langue:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.2 Chat

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique	ByteDance Seed: Seed-2.0-Mini medium Sortie: 2026-02-14	OpenAI: GPT-5.2 Chat none Sortie: 2025-12-11
Rang	#23	#15
Score moy.	6.9	7.4
Cohérence	9.1	9.1
Coût par résultat	0.280	2.440
Coût total	$0.028	$0.269
Tests corrects
Taux de réussite par tentative	68.8%	75.0%
Tests instables	2	2
common.totalRuns	48 (16 x 3)	48 (16 x 3)
Jetons de sortie	1,965	15,845
Jetons de raisonnement	58,456	0
Temps de réponse (moy.)	65.09s	7.03s
Temps de réponse (max)	262.83s	38.52s
Temps de réponse (total)	846.14s	112.51s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		3.97s	1,651	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		9.12s	1,243	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
OpenAI: GPT-5.2 Chat	9.9	10.0	100.0%	0		3.05s	980	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
OpenAI: GPT-5.2 Chat	4.0	10.0	33.3%	0		17.78s	7,810	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	6.0	3.4	33.3%	1		36.65s	213	4,210
OpenAI: GPT-5.2 Chat	4.0	3.0	33.3%	1		3.20s	335	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
OpenAI: GPT-5.2 Chat	6.0	6.1	83.3%	1		5.46s	1,528	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
OpenAI: GPT-5.2 Chat	7.0	10.0	66.7%	0		4.42s	1,743	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
OpenAI: GPT-5.2 Chat	10.0	10.0	100.0%	0		4.68s	555	0

Comparaison rapide

Changer la paire de comparaison

GPT-5.2 ChatnonevsGLM 5medium Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsStep 3.5 FlashmediumDisponible gratuitement Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Claude Sonnet 4.6nonevsSeed-2.0-Minimedium DeepSeek V3.2mediumvsGPT-5.2 Chatnone Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone GPT-5.2 ChatnonevsMiMo-V2-Flashmedium Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6mediumvsGPT-5.2 Chatnone GPT-5.2 ChatnonevsQwen3.5-122B-A10Bmedium