Navigare
AI BENCHY
Compară Grafice Metodologie
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică Google: Gemini 3.1 Flash Lite Preview low Lansare: 2026-03-03 Qwen: Qwen3.5-Flash medium Lansare: 2026-02-24
Scor mediu 7.6 7.0
Rang #12 #24
Teste corecte
Consistență 10.0 7.8
Cost per rezultat 0.170 0.565
Cost total $0.019 $0.057
Rată de trecere pe încercare 73.3% 82.2%
Teste instabile 0 4
common.totalRuns 45 (15 x 3) 45 (15 x 3)
Tokenuri de ieșire 1,542 1,708
Tokenuri de raționament 6,888 131,466
Timp de răspuns (mediu) 3.49s 72.86s
Timp de răspuns (maxim) 11.91s 234.29s
Timp de răspuns (total) 52.29s 1092.84s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

Comparație rapidă

Schimbă perechea de comparație