Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-Flash vs xAI: Grok 4.20

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-02

Metrică Qwen3.5-Flash Qwen3.5-Flash none Lansare: 2026-02-24 Grok 4.20 Grok 4.20 medium Lansare: 2026-03-31
Scor 6.0 7.1
Rang #54 #40
Consistență 9.6 8.2
Teste corecte
Rată de trecere pe încercare 43.1% 66.7%
Teste instabile 1 4
Rulări totale 51 51
Cost per rezultat 0.077 7.358
Cost total $0.006 $0.663
Preț de intrare $0.065 / 1M $2.000 / 1M
Preț de ieșire $0.260 / 1M $6.000 / 1M
Tokenuri de ieșire 3,777 1,494
Tokenuri de raționament 0 97,078
Timp de răspuns (mediu) 3.36s 9.50s
Timp de răspuns (maxim) 13.73s 29.87s
Timp de răspuns (total) 57.15s 161.54s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 3.3 10.0 0.0% 0 5.90s 608 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

Comparație rapidă

Schimbă perechea de comparație