AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-122B-A10B

Résumé

Comparaison benchmark Seed-2.0-Lite vs Qwen3.5-122B-A10B : Seed-2.0-Lite mène au score moyen avec 6.2 vs 5.3. Seed-2.0-Lite a le coût de benchmark le plus bas avec $0.019 vs $0.020. Seed-2.0-Lite est plus rapide avec 2.49s vs 3.41s, avec des taux de réussite de 46.0% vs 31.8%.

Modèle recommandé: Seed-2.0-Lite - Il obtient le meilleur score de cette comparaison (6.2) et le meilleur équilibre global entre coût et temps de réponse sur les 2 modèles.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Sortie: 2026-02-24

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Sortie: 2026-02-24
Score	6.2	5.3
Rang	#92	#125
Fiabilité	10.0	10.0
Cohérence	8.4	9.6
Tests corrects
Taux de réussite par tentative	46.0%	31.8%
Tests instables	4	1
Exécutions totales	63	63
Coût par résultat	0.228	0.393
Coût total	$0.019	$0.020
Prix d'entrée	$0.250 / 1M	$0.260 / 1M
Prix de sortie	$2.000 / 1M	$2.080 / 1M
Total des jetons d'entrée	46,573	47,735
Jetons de sortie	3,259	3,383
Jetons de raisonnement	0	0
Temps de réponse (moy.)	2.49s	3.41s
Temps de réponse (max)	6.70s	46.00s
Temps de réponse (total)	52.26s	71.59s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#92 Seed-2.0-Lite

none

Coût: $0.005
Temps: 83.8s
Tokens: 2,311 tok

#125 Qwen3.5-122B-A10B

none

Coût: $0.016
Temps: 44.5s
Tokens: 6,431 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	696	312	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.5-122B-A10B	3.7	7.0	22.2%	1		2.77s	7,913	693	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	20,175	1,137	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	7,794	243	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	789	15	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	522	66	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	711	69	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	714	575	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	8,211	264	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	210	9	0

Comparaison rapide

Changer la paire de comparaison