Navigatie
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemma 4 31B vs Qwen: Qwen3.5-122B-A10B

Benchmarks gegenereerd uit AI BENCHY-testsuites op: 2026-04-02

Metriek Gemma 4 31B Gemma 4 31B medium Releasedatum: 2026-04-02 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Releasedatum: 2026-02-24
Score 8.6 8.4
Rang #5 #12
Consistentie 9.6 9.0
Correcte tests
Slaagpercentage per poging 80.4% 80.4%
Instabiele tests 1 2
Totaal runs 51 51
Kosten per resultaat 0.109 3.883
Totale kosten $0.015 $0.505
Invoerprijs $0.140 / 1M $0.260 / 1M
Uitvoerprijs $0.400 / 1M $2.080 / 1M
Uitvoer-tokens 9,568 17,313
Redeneer-tokens 22,501 151,974
Responstijd (gem.) 21.81s 29.05s
Responstijd (max) 68.92s 119.29s
Responstijd (totaal) 327.16s 493.86s

Topmodellen op score

Score vs totale kosten

Responstijd (gem.)

Score vs Responstijd (gem.)

Totaal aantal uitvoer-tokens

Score vs Totaal aantal uitvoer-tokens

Categorie-uitsplitsing

Anti-AI-trucs Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 269 16,835
Gecombineerd Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 483 11,337
Gegevensparsering en extractie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 270 16,558
Domeinspecifiek Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 15,537 64,889
Algemene intelligentie Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 66 7,592
Instructies opvolgen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 77 7,372
Puzzle Solving Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.18s 289 26,165
Toolaanroepen Score Consistentie Slaagpercentage per poging Instabiele tests Correcte tests Responstijd (gem.) Uitvoer-tokens Redeneer-tokens
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 322 1,226

Snelle vergelijking

Vergelijkingspaar wisselen