AI BENCHY
Compară
❤️ Made by XCS

Nume model

Google: Gemini 3.1 Pro Preview

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică Google: Gemini 3.1 Pro Preview
Rang#2
CompanieGoogle
Score 9.25
Consistență 10.00
Cost per rezultat 2.5543
Cost total $0.28097
Teste corecte 11/12
Rată de trecere pe încercare 91.7%
Teste instabile 0
Tokenuri de ieșire 632
Tokenuri de raționament 21,277

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 5.75 $0.02289
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.05541
Domain specific 2/3 7.00 10.00 66.7% 0 5.63 $0.12975
Instructions following 2/2 10.00 10.00 100.0% 0 5.67 $0.03134
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.89 $0.04159

Modele comparate

Compară Google: Gemini 3.1 Pro Preview cu...

#1 · Google

Google: Gemini 3 Flash Preview

Raționament (medium)

Score: 9.92

Consistență: 10.00

Rată de trecere pe încercare: 100.0%

Teste instabile: 0

Cost per rezultat: 0.8502

Teste corecte: 12/12

Cost total: $0.10203

Compară

#3 · Google

Google: Gemini 3 Pro Preview

Raționament (medium)

Score: 8.42

Consistență: 10.00

Rată de trecere pe încercare: 83.3%

Teste instabile: 0

Cost per rezultat: 0.8028

Teste corecte: 10/12

Cost total: $0.08029

Compară

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raționament (medium)

Score: 8.42

Consistență: 9.30

Rată de trecere pe încercare: 86.1%

Teste instabile: 1

Cost per rezultat: 2.3151

Teste corecte: 10/12

Cost total: $0.23151

Compară

Comparație rapidă

Compară Google: Gemini 3.1 Pro Preview cu...