Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3.7 Plus

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-06-03

Metriek Gemini 3 Flash Preview Gemini 3 Flash Preview low Releasedatum: 2025-12-17 Qwen3.7 Plus Qwen3.7 Plus medium Releasedatum: 2026-06-03
Score 8.6 8.4
Rang #12 #16
Betrouwbaarheid 10.0 9.9
Consistentie 9.6 9.2
Correcte tests
Slaagpercentage per poging 81.7% 80.0%
Instabiele tests 1 2
Totaal runs 60 60
Kosten per resultaat 0.658 1.324
Totale kosten $0.106 $0.199
Invoerprijs $0.500 / 1M $0.400 / 1M
Uitvoerprijs $3.000 / 1M $1.600 / 1M
Totaal aantal invoer-tokens 33,766 38,104
Uitvoer-tokens 2,070 2,107
Redeneer-tokens 27,348 112,479
Responstijd (gem.) 5.81s 36.84s
Responstijd (max) 14.72s 178.04s
Responstijd (totaal) 116.25s 736.86s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 7.3 10.0 50.0% 0 6.66s 5,119 450 6,251
Qwen3.7 Plus 6.5 5.9 66.7% 1 122.40s 3,637 396 30,301
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Invoer-tokens Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

Snelle vergelijking

Vergelijkingspaar wisselen