Navigare
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-14

Metrică Seed-2.0-Mini Seed-2.0-Mini medium Lansare: 2026-02-14 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lansare: 2026-02-15
Scor 7.5 6.8
Rang #36 #46
Consistență 9.2 9.3
Teste corecte
Rată de trecere pe încercare 66.7% 53.7%
Teste instabile 2 2
Rulări totale 54 54
Cost per rezultat 0.333 0.182
Cost total $0.037 $0.017
Preț de intrare $0.100 / 1M $0.260 / 1M
Preț de ieșire $0.400 / 1M $1.560 / 1M
Tokenuri de ieșire 2,419 2,461
Tokenuri de raționament 79,238 0
Timp de răspuns (mediu) 69.70s 2.60s
Timp de răspuns (maxim) 262.83s 6.65s
Timp de răspuns (total) 1045.47s 31.23s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Qwen3.5 Plus 2026-02-15 4.8 10.0 25.0% 0 1.91s 517 0
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Qwen3.5 Plus 2026-02-15 6.3 3.7 33.3% 1 3.63s 443 0
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 6.65s 314 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.89s 243 0
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 1.17s 17 0
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Qwen3.5 Plus 2026-02-15 4.4 3.0 33.3% 1 2.26s 117 0
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 1.67s 72 0
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Qwen3.5 Plus 2026-02-15 7.7 10.0 66.7% 0 2.82s 516 0
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 3.33s 222 0

Comparație rapidă

Schimbă perechea de comparație