Navigare
AI BENCHY
Compară Grafice Metodologie
❤️ Made by XCS
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Flash Lite Preview

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică ByteDance Seed: Seed-2.0-Mini medium Lansare: 2026-02-14 Google: Gemini 3.1 Flash Lite Preview high Lansare: 2026-03-03
Rang #23 #8
Scor mediu 6.9 8.2
Consistență 9.1 9.6
Cost per rezultat 0.280 19.243
Cost total $0.028 $2.310
Teste corecte
Rată de trecere pe încercare 68.8% 77.1%
Teste instabile 2 1
common.totalRuns 48 (16 x 3) 48 (16 x 3)
Tokenuri de ieșire 1,965 1,283
Tokenuri de raționament 58,456 1,533,310
Timp de răspuns (mediu) 65.09s 68.83s
Timp de răspuns (maxim) 262.83s 280.52s
Timp de răspuns (total) 846.14s 1101.32s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 7.0 10.0 66.7% 0 98.99s 354 9,352
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 43.87s 144 193,077
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 280.52s 335 380,440
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 9.9 10.0 100.0% 0 24.27s 246 2,743
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 7.16s 279 6,186
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 0.0% 0 0ms 0 0
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 127.58s 18 566,202
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 6.0 3.4 33.3% 1 36.65s 213 4,210
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 5.25s 117 3,915
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Google: Gemini 3.1 Flash Lite Preview 9.0 6.9 66.7% 1 70.07s 69 190,053
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 7.0 7.2 88.9% 1 25.85s 457 5,060
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 46.33s 87 190,953
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.73s 234 2,484

Comparație rapidă

Schimbă perechea de comparație