Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Pro Preview

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-12

Metrică Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19
Rang #3 #2
Scor mediu 8.5 9.4
Consistență 8.7 10.0
Cost per rezultat 0.870 3.417
Cost total $0.105 $0.513
Teste corecte
Rată de trecere pe încercare 87.5% 93.8%
Teste instabile 3 0
Rulări totale 48 48
Tokenuri de ieșire 2,815 1,521
Tokenuri de raționament 44,618 35,656
Timp de răspuns (mediu) 29.39s 16.60s
Timp de răspuns (maxim) 168.71s 40.61s
Timp de răspuns (total) 470.29s 149.36s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 23.34s 990 7,037
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.52s 106 2,533
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Gemini 3.1 Pro Preview 9.0 10.0 100.0% 0 40.61s 432 9,281
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 9.9 10.0 100.0% 0 9.07s 246 1,742
Gemini 3.1 Pro Preview 9.9 10.0 100.0% 0 7.72s 279 3,904
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 4.0 7.2 55.6% 1 88.74s 15 23,897
Gemini 3.1 Pro Preview 7.0 10.0 66.7% 0 32.73s 18 12,424
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 7.0 3.6 66.7% 1 18.25s 304 1,620
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 9.3 7.9 88.9% 1 11.03s 461 3,532
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

Comparație rapidă

Schimbă perechea de comparație