Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Qwen3.6 Plus Preview

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-22

Metriek Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Releasedatum: 2026-05-08 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Releasedatum: 2026-04-20 Gratis beschikbaar
Score 7.4 8.2
Rang #50 #16
Betrouwbaarheid 10.0 n.v.t.
Consistentie 9.2 10.0
Correcte tests
Slaagpercentage per poging 65.0% 75.0%
Instabiele tests 2 0
Totaal runs 60 57
Kosten per resultaat 0.217 0.000
Totale kosten $0.026 $0.000
Invoerprijs $0.250 / 1M $0.000 / 1M
Uitvoerprijs $1.500 / 1M $0.000 / 1M
Uitvoer-tokens 2,726 1,153
Redeneer-tokens 8,951 62,197
Responstijd (gem.) 1.92s 15.25s
Responstijd (max) 5.66s 43.55s
Responstijd (totaal) 38.45s 182.96s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 11.69s 61 5,812
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 6.8 10.0 50.0% 0 1.71s 465 763
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 3.40s 27 1,383
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.52s 27 2,998
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420
Qwen3.6 Plus Preview 0.0 0.0 0.0% 0 0ms 0 0

Snelle vergelijking

Vergelijkingspaar wisselen