Navigatie
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Qwen: Qwen3.5-27B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-14

Metriek Gemini 3 Flash Preview Gemini 3 Flash Preview low Releasedatum: 2025-12-17 Qwen3.5-27B Qwen3.5-27B medium Releasedatum: 2026-02-24
Score 8.8 8.4
Rang #3 #8
Consistentie 9.5 8.8
Correcte tests
Slaagpercentage per poging 85.2% 81.5%
Instabiele tests 1 3
Totaal runs 54 54
Kosten per resultaat 0.604 3.822
Totale kosten $0.091 $0.497
Invoerprijs $0.500 / 1M $0.195 / 1M
Uitvoerprijs $3.000 / 1M $1.560 / 1M
Uitvoer-tokens 2,018 2,500
Redeneer-tokens 23,273 242,500
Responstijd (gem.) 6.01s 53.03s
Responstijd (max) 14.72s 163.96s
Responstijd (totaal) 108.12s 954.46s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 281 3,082
Qwen3.5-27B 8.7 7.9 91.7% 1 19.75s 569 31,505
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.94s 426 2,717
Qwen3.5-27B 10.0 10.0 100.0% 0 70.35s 375 19,165
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 326 0
Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 279 3,656
Qwen3.5-27B 10.0 10.0 100.0% 0 30.26s 270 16,150
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 12 6,410
Qwen3.5-27B 5.3 10.0 33.3% 0 79.53s 43 52,368
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 120 981
Qwen3.5-27B 6.1 3.1 66.7% 1 101.41s 70 23,147
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 71 2,752
Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.11s 269 3,260
Qwen3.5-27B 8.2 7.7 77.8% 1 64.61s 245 77,213
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 234 415
Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

Snelle vergelijking

Vergelijkingspaar wisselen