AI BENCHY
Compară
❤️ Made by XCS

Nume model

OpenAI: GPT-5.2

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică OpenAI: GPT-5.2
Rang#5
CompanieOpenAI
Score 7.92
Consistență 9.30
Cost per rezultat 2.2838
Cost total $0.20554
Teste corecte 9/12
Rată de trecere pe încercare 80.6%
Teste instabile 1
Tokenuri de ieșire 1,123
Tokenuri de raționament 12,448

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 8.25 $0.01131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.02230
Domain specific 1/3 4.00 7.21 55.6% 1 3.17 $0.13697
Instructions following 2/2 9.50 10.00 100.0% 0 8.00 $0.01071
Puzzle Solving 2/3 8.00 10.00 66.7% 0 8.83 $0.02427

Modele comparate

Compară OpenAI: GPT-5.2 cu...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raționament (medium)

Score: 8.42

Consistență: 9.30

Rată de trecere pe încercare: 86.1%

Teste instabile: 1

Cost per rezultat: 2.3151

Teste corecte: 10/12

Cost total: $0.23151

Compară

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

Raționament (medium)

Score: 7.00

Consistență: 9.30

Rată de trecere pe încercare: 69.4%

Teste instabile: 1

Cost per rezultat: 9.3797

Teste corecte: 8/12

Cost total: $0.75038

Compară

#3 · Google

Google: Gemini 3 Pro Preview

Raționament (medium)

Score: 8.42

Consistență: 10.00

Rată de trecere pe încercare: 83.3%

Teste instabile: 0

Cost per rezultat: 0.8028

Teste corecte: 10/12

Cost total: $0.08029

Compară

Comparație rapidă

Compară OpenAI: GPT-5.2 cu...