Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Flash Lite Preview

Résumé

Comparaison benchmark Seed-2.0-Lite vs Gemini 3.1 Flash Lite Preview : Seed-2.0-Lite mène au score moyen avec 8.2 vs 7.4. Gemini 3.1 Flash Lite Preview a le coût de benchmark le plus bas avec $0.026 vs $0.175. Gemini 3.1 Flash Lite Preview est plus rapide avec 2.77s vs 47.07s, avec des taux de réussite de 76.2% vs 61.9%.

Modèle recommandé: Gemini 3.1 Flash Lite Preview - Son score reste proche du meilleur score ici (7.4 vs 8.2) tout en coûtant environ 6.9x moins que Seed-2.0-Lite.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-10

Métrique Seed-2.0-Lite Seed-2.0-Lite medium Sortie: 2026-02-14 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Sortie: 2026-03-03
Score 8.2 7.4
Rang #20 #51
Fiabilité 10.0 10.0
Cohérence 9.0 10.0
Tests corrects
Taux de réussite par tentative 76.2% 61.9%
Tests instables 3 0
Exécutions totales 63 63
Coût par résultat 1.250 0.196
Coût total $0.175 $0.026
Prix d'entrée $0.250 / 1M $0.250 / 1M
Prix de sortie $2.000 / 1M $1.500 / 1M
Total des jetons d'entrée 46,740 32,715
Jetons de sortie 3,230 2,286
Jetons de raisonnement 78,406 9,166
Temps de réponse (moy.) 47.07s 2.77s
Temps de réponse (max) 254.92s 11.91s
Temps de réponse (total) 988.37s 58.12s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

#51 Gemini 3.1 Flash Lite Preview

low
Cost
$0.002
Time
3.7s
Tokens
1,203 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 506 462 1,638
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 1.39s 8,138 660 1,060
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 8,381 225 762
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 7,455 291 696
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 641 18 1,212
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 490 69 384
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 621 72 753
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 566 243 1,248
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 5,757 237 993
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 160 9 420

Comparaison rapide

Changer la paire de comparaison