AI BENCHY
Vergelijken
❤️ Made by XCS

Modelnaam

Google: Gemini 3.1 Pro Preview

Benchmarks gegenereerd uit Aibenchy-testsuites op : 19 feb 2026

Metriek Google: Gemini 3.1 Pro Preview
Rang#2
BedrijfGoogle
Score 9.25
Consistentie 10.00
Kosten per resultaat 2.5543
Totale kosten $0.28097
Correcte tests 11/12
Slaagpercentage per poging 91.7%
Instabiele tests 0
Uitvoer-tokens 632
Redeneer-tokens 21,277

Categorie-uitsplitsing

Categorie Volledig geslaagde tests Score Consistentie Slaagpercentage per poging Instabiele tests Redeneerscore Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 5.75 $0.02289
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.05541
Domain specific 2/3 7.00 10.00 66.7% 0 5.63 $0.12975
Instructions following 2/2 10.00 10.00 100.0% 0 5.67 $0.03134
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.89 $0.04159

Vergeleken modellen

Vergelijk Google: Gemini 3.1 Pro Preview met...

#1 · Google

Google: Gemini 3 Flash Preview

Redenering (medium)

Score: 9.92

Consistentie: 10.00

Slaagpercentage per poging: 100.0%

Instabiele tests: 0

Kosten per resultaat: 0.8502

Correcte tests: 12/12

Totale kosten: $0.10203

Vergelijken

#3 · Google

Google: Gemini 3 Pro Preview

Redenering (medium)

Score: 8.42

Consistentie: 10.00

Slaagpercentage per poging: 83.3%

Instabiele tests: 0

Kosten per resultaat: 0.8028

Correcte tests: 10/12

Totale kosten: $0.08029

Vergelijken

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Redenering (medium)

Score: 8.42

Consistentie: 9.30

Slaagpercentage per poging: 86.1%

Instabiele tests: 1

Kosten per resultaat: 2.3151

Correcte tests: 10/12

Totale kosten: $0.23151

Vergelijken

Snelle vergelijking

Vergelijk Google: Gemini 3.1 Pro Preview met...