AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs xAI: Grok 4.1 Fast

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-26

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Grok 4.1 Fast Grok 4.1 Fast medium Sortie: 2025-11-19
Score	6.2	6.7
Rang	#72	#63
Fiabilité	N/D	N/D
Cohérence	7.7	7.2
Tests corrects
Taux de réussite par tentative	55.6%	64.8%
Tests instables	5	6
Exécutions totales	54	54
Coût par résultat	0.200	0.613
Coût total	$0.016	$0.056
Prix d'entrée	$0.250 / 1M	$0.200 / 1M
Prix de sortie	$2.000 / 1M	$0.500 / 1M
Jetons de sortie	3,129	2,010
Jetons de raisonnement	0	91,298
Temps de réponse (moy.)	2.53s	23.88s
Temps de réponse (max)	6.70s	121.79s
Temps de réponse (total)	45.46s	262.66s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Grok 4.1 Fast	8.7	7.9	91.7%	1		3.81s	108	4,741

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
Grok 4.1 Fast	2.3	1.1	33.3%	1		23.58s	821	6,703

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		6.63s	180	5,409

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Grok 4.1 Fast	5.8	4.4	66.7%	2		121.79s	11	37,657

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Grok 4.1 Fast	4.2	9.9	0.0%	0		16.25s	127	3,456

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Grok 4.1 Fast	6.6	10.0	50.0%	0		5.30s	55	3,489

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Grok 4.1 Fast	5.3	7.2	44.4%	1		8.08s	187	6,086

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Grok 4.1 Fast	2.8	1.6	33.3%	1		27.71s	260	11,485

Comparaison rapide

Changer la paire de comparaison

DeepSeek V4 PrononevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none GPT-5.5nonevsGrok 4.1 Fastmedium Seed-2.0-LitenonevsGPT-5 Nanomedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium DeepSeek V4 ProhighvsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsMiMo-V2-Omninone Gemma 4 31BnoneDisponible gratuitementvsGrok 4.1 Fastmedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponible gratuitement Seed-2.0-LitenonevsMercury 2medium Grok 4.1 FastmediumvsGLM 5V Turbonone Qwen3.5-FlashnonevsGrok 4.1 Fastmedium