Navigatie
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-05-29

Metriek Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Releasedatum: 2026-02-19 Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Releasedatum: 2026-02-15
Score 9.3 8.1
Rang #4 #23
Betrouwbaarheid 10.0 10.0
Consistentie 10.0 8.8
Correcte tests
Slaagpercentage per poging 90.0% 76.7%
Instabiele tests 0 3
Totaal runs 60 60
Kosten per resultaat 5.587 2.251
Totale kosten $1.006 $0.316
Invoerprijs $2.000 / 1M $0.260 / 1M
Uitvoerprijs $12.000 / 1M $1.560 / 1M
Uitvoer-tokens 1,971 2,145
Redeneer-tokens 75,384 172,563
Responstijd (gem.) 20.77s 67.58s
Responstijd (max) 88.68s 266.69s
Responstijd (totaal) 269.96s 878.57s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Qwen3.5 Plus 2026-02-15 8.2 7.9 83.3% 1 45.78s 205 21,236
Programmeren Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 7.0 9.8 50.0% 0 54.28s 429 37,735
Qwen3.5 Plus 2026-02-15 7.6 6.7 66.7% 1 193.80s 406 63,554
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.85s 421 7,906
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 46.91s 270 14,916
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Qwen3.5 Plus 2026-02-15 5.3 10.0 33.3% 0 17.50s 35 16,680
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Qwen3.5 Plus 2026-02-15 4.7 1.6 66.7% 1 79.86s 73 8,675
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 31.93s 101 7,704
Puzzeloplossing Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 235 3,128
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 32.50s 301 13,853
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Qwen3.5 Plus 2026-02-15 10.0 10.0 100.0% 0 7.54s 309 909
Algemene kennis Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 12 1,297
Qwen3.5 Plus 2026-02-15 3.0 10.0 0.0% 0 103.81s 24 17,130

Snelle vergelijking

Vergelijkingspaar wisselen