AI BENCHY
Compară
❤️ Made by XCS

Nume model

OpenAI: gpt-oss-120b

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică OpenAI: gpt-oss-120b
Rang#12
CompanieOpenAI
Score 5.75
Consistență 7.19
Cost per rezultat 0.0951
Cost total $0.00571
Teste corecte 6/12
Rată de trecere pe încercare 63.9%
Teste instabile 4
Tokenuri de ieșire 8,060
Tokenuri de raționament 23,792

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Modele comparate

Compară OpenAI: gpt-oss-120b cu...

#11 · OpenAI

OpenAI: GPT-5 Nano

Raționament (medium)

Score: 5.92

Consistență: 6.03

Rată de trecere pe încercare: 72.2%

Teste instabile: 6

Cost per rezultat: 0.4675

Teste corecte: 6/12

Cost total: $0.02806

Compară

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Fără raționament

Score: 5.75

Consistență: 9.42

Rată de trecere pe încercare: 52.8%

Teste instabile: 1

Cost per rezultat: 0.9480

Teste corecte: 6/12

Cost total: $0.05688

Compară

#10 · Google

Google: Gemini 3 Flash Preview

Fără raționament

Score: 6.25

Consistență: 8.60

Rată de trecere pe încercare: 66.7%

Teste instabile: 2

Cost per rezultat: 0.0754

Teste corecte: 7/12

Cost total: $0.00528

Compară

Comparație rapidă

Compară OpenAI: gpt-oss-120b cu...