Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-122B-A10B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-01

Metriek Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Releasedatum: 2026-03-03 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24
Score 7.6 7.7
Rang #47 #41
Betrouwbaarheid 10.0 10.0
Consistentie 10.0 8.8
Correcte tests
Slaagpercentage per poging 65.0% 71.7%
Instabiele tests 0 3
Totaal runs 60 60
Kosten per resultaat 0.186 5.031
Totale kosten $0.025 $0.509
Invoerprijs $0.250 / 1M $0.260 / 1M
Uitvoerprijs $1.500 / 1M $2.080 / 1M
Uitvoer-tokens 2,280 26,166
Redeneer-tokens 8,829 213,524
Responstijd (gem.) 2.85s 39.40s
Responstijd (max) 11.91s 168.16s
Responstijd (totaal) 57.08s 788.00s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 654 723
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 8,036 45,074
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 243 1,248
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 284 27,575
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 9 420
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 822 15,066

Snelle vergelijking

Vergelijkingspaar wisselen