AI BENCHY
Compară
❤️ Made by XCS
Your ad here

Nume model

OpenAI: GPT-5.3-Codex

Raționament (medium)

Benchmark-urile au fost generate din suitele de teste AI BENCHY la : 24 feb. 2026

Metrică OpenAI: GPT-5.3-Codex
Rang#6
CompanieOpenAI
Score 7.77
Consistență 8.75
Cost per rezultat 4.9342
Cost total $0.44408
Teste corecte
Rată de trecere pe încercare 76.9%
Teste instabile 2
Tokenuri de ieșire 947
Tokenuri de raționament 29,564
Timp de răspuns (medie)17944ms
Timp de răspuns (total)233267ms
Timp de răspuns (maxim)100927ms

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Timp de răspuns (medie) Cost
Trucuri anti-AI 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Parsare și extragere de date 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Specific domeniului 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Respectarea instrucțiunilor 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Modele comparate

Compară OpenAI: GPT-5.3-Codex cu...

#5 · Google

Google: Gemini 3 Flash Preview

Raționament (low)

Score: 8.23

Consistență: 8.71

Rată de trecere pe încercare: 82.0%

Teste instabile: 2

Cost per rezultat: 0.6173

Teste corecte:

Cost total: $0.06174

Compară

#7 · OpenAI

OpenAI: GPT-5.2

Raționament (medium)

Score: 7.38

Consistență: 8.73

Rată de trecere pe încercare: 76.9%

Teste instabile: 2

Cost per rezultat: 2.5637

Teste corecte:

Cost total: $0.23074

Compară

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Raționament (medium)

Score: 8.54

Consistență: 9.35

Rată de trecere pe încercare: 87.2%

Teste instabile: 1

Cost per rezultat: 2.1621

Teste corecte:

Cost total: $0.23784

Compară

Comparație rapidă

Compară OpenAI: GPT-5.3-Codex cu...