AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-27B

Résumé

Comparaison benchmark Seed-2.0-Lite vs Qwen3.5-27B : Seed-2.0-Lite mène au score moyen avec 6.2 vs 5.9. Qwen3.5-27B a le coût de benchmark le plus bas avec $0.015 vs $0.019. Qwen3.5-27B est plus rapide avec 1.68s vs 2.49s, avec des taux de réussite de 46.0% vs 38.1%.

Modèle recommandé: Seed-2.0-Lite - Il obtient le meilleur score de cette comparaison (6.2) et le meilleur équilibre global entre coût et temps de réponse sur les 2 modèles.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-10

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24

Métrique	Seed-2.0-Lite Seed-2.0-Lite none Sortie: 2026-02-14	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24
Score	6.2	5.9
Rang	#107	#121
Fiabilité	10.0	10.0
Cohérence	8.4	9.3
Tests corrects
Taux de réussite par tentative	46.0%	38.1%
Tests instables	4	2
Exécutions totales	63	63
Coût par résultat	0.228	0.249
Coût total	$0.019	$0.015
Prix d'entrée	$0.250 / 1M	$0.195 / 1M
Prix de sortie	$2.000 / 1M	$1.560 / 1M
Total des jetons d'entrée	46,573	44,478
Jetons de sortie	3,259	3,592
Jetons de raisonnement	0	0
Temps de réponse (moy.)	2.49s	1.68s
Temps de réponse (max)	6.70s	9.39s
Temps de réponse (total)	52.26s	35.25s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 Seed-2.0-Lite

none

Coût: $0.005
Temps: 83.8s
Tokens: 2,311 tok

#121 Qwen3.5-27B

none

Coût: $0.007
Temps: 42.9s
Tokens: 4,273 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	696	267	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.5-27B	5.8	10.0	33.3%	0		1.80s	7,913	415	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	16,918	1,461	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	789	15	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	522	126	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	711	69	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	714	683	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	8,211	303	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	210	10	0

Comparaison rapide

Changer la paire de comparaison