AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs xAI: Grok 4.20

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-14

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Grok 4.20 Grok 4.20 medium Sortie: 2026-03-31

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Grok 4.20 Grok 4.20 medium Sortie: 2026-03-31
Score	6.2	7.0
Rang	#58	#44
Cohérence	7.7	7.8
Tests corrects
Taux de réussite par tentative	55.6%	66.7%
Tests instables	5	5
Exécutions totales	54	54
Coût par résultat	0.200	8.252
Coût total	$0.016	$0.743
Prix d'entrée	$0.250 / 1M	$2.000 / 1M
Prix de sortie	$2.000 / 1M	$6.000 / 1M
Jetons de sortie	3,129	1,744
Jetons de raisonnement	0	109,882
Temps de réponse (moy.)	2.53s	10.33s
Temps de réponse (max)	6.70s	29.87s
Temps de réponse (total)	45.46s	185.87s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Grok 4.20	8.2	7.9	83.3%	1		3.36s	280	8,476

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
Grok 4.20	4.3	1.1	66.7%	1		24.33s	250	12,804

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Grok 4.20	10.0	10.0	100.0%	0		17.40s	232	9,556

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Grok 4.20	10.0	10.0	100.0%	0		4.17s	180	5,333

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Grok 4.20	5.3	10.0	33.3%	0		27.03s	375	49,339

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Grok 4.20	5.8	2.8	66.7%	1		7.09s	47	4,252

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Grok 4.20	7.3	5.9	83.3%	1		4.42s	40	5,474

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Grok 4.20	6.4	7.7	55.6%	1		3.89s	143	8,028

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Grok 4.20	3.0	10.0	0.0%	0		13.68s	197	6,620

Comparaison rapide

Changer la paire de comparaison

Gemma 4 31BnoneDisponible gratuitementvsGrok 4.20medium Seed-2.0-LitenonevsGPT-5 Nanomedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponible gratuitement Grok 4.20mediumvsGLM 5none Seed-2.0-LitenonevsMercury 2medium Claude Sonnet 4.6nonevsGrok 4.20medium Seed-2.0-LitenonevsMiniMax M2.5mediumDisponible gratuitement Grok 4.20mediumvsMiMo-V2-Omninone Seed-2.0-LitenonevsGrok 4.1 Fastmedium Seed-2.0-LitenonevsMistral Small 4medium Seed-2.0-LitenonevsNemotron 3 SupermediumDisponible gratuitement