Navigare
AI BENCHY
Compară Grafice Metodologie
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică Google: Gemini 3.1 Flash Lite Preview high Lansare: 2026-03-03 Qwen: Qwen3.5-Flash medium Lansare: 2026-02-24
Rang #8 #24
Scor mediu 8.2 6.9
Consistență 9.6 7.5
Cost per rezultat 19.243 0.720
Cost total $2.310 $0.072
Teste corecte
Rată de trecere pe încercare 77.1% 81.3%
Teste instabile 1 5
common.totalRuns 48 (16 x 3) 48 (16 x 3)
Tokenuri de ieșire 1,283 1,807
Tokenuri de raționament 1,533,310 169,952
Timp de răspuns (mediu) 68.83s 70.81s
Timp de răspuns (maxim) 280.52s 234.29s
Timp de răspuns (total) 1101.32s 1132.90s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 43.87s 144 193,077
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 280.52s 335 380,440
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 7.16s 279 6,186
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 127.58s 18 566,202
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 5.25s 117 3,915
Qwen: Qwen3.5-Flash 5.0 3.1 66.7% 1 40.05s 99 38,486
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 9.0 6.9 66.7% 1 70.07s 69 190,053
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 46.33s 87 190,953
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 7.73s 234 2,484
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

Comparație rapidă

Schimbă perechea de comparație