Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3 Flash Preview

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-26

Metrică Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14 Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lansare: 2025-12-17
Scor 6.2 10.0
Rang #72 #1
Fiabilitate N/D N/D
Consistență 7.7 10.0
Teste corecte
Rată de trecere pe încercare 55.6% 100.0%
Teste instabile 5 0
Rulări totale 54 18
Cost per rezultat 0.200 0.600
Cost total $0.016 $0.108
Preț de intrare $0.250 / 1M $0.500 / 1M
Preț de ieșire $2.000 / 1M $3.000 / 1M
Tokenuri de ieșire 3,129 655
Tokenuri de raționament 0 33,749
Timp de răspuns (mediu) 2.53s 12.11s
Timp de răspuns (maxim) 6.70s 82.37s
Timp de răspuns (total) 45.46s 217.93s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.26s 110 1,076
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 82.37s 144 16,257
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 23.58s 117 3,495
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 7.62s 93 2,197
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 14.81s 4 7,228
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.34s 24 635
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.30s 24 903
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.86s 61 1,455
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.78s 78 503

Comparație rapidă

Schimbă perechea de comparație