AI BENCHY
Compară
❤️ Made by XCS

Nume model

Qwen: Qwen3.5 Plus 2026-02-15

Benchmark-urile au fost generate din suitele de teste Aibenchy la : 19 feb. 2026

Metrică Qwen: Qwen3.5 Plus 2026-02-15
Rang#4
CompanieQwen
Score 8.42
Consistență 9.30
Cost per rezultat 2.3151
Cost total $0.23151
Teste corecte 10/12
Rată de trecere pe încercare 86.1%
Teste instabile 1
Tokenuri de ieșire 802
Tokenuri de raționament 93,972

Defalcare pe categorii

Categorie Teste trecute complet Score Consistență Rată de trecere pe încercare Teste instabile Scor de raționament Cost
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.17 $0.00855
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.61 $0.03952
Domain specific 1/3 4.00 7.21 44.4% 1 7.28 $0.10564
Instructions following 2/2 9.50 9.99 100.0% 0 9.33 $0.02275
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.28 $0.05508

Modele comparate

Compară Qwen: Qwen3.5 Plus 2026-02-15 cu...

#3 · Google

Google: Gemini 3 Pro Preview

Raționament (medium)

Score: 8.42

Consistență: 10.00

Rată de trecere pe încercare: 83.3%

Teste instabile: 0

Cost per rezultat: 0.8028

Teste corecte: 10/12

Cost total: $0.08029

Compară

#5 · OpenAI

OpenAI: GPT-5.2

Raționament (medium)

Score: 7.92

Consistență: 9.30

Rată de trecere pe încercare: 80.6%

Teste instabile: 1

Cost per rezultat: 2.2838

Teste corecte: 9/12

Cost total: $0.20554

Compară

#2 · Google

Google: Gemini 3.1 Pro Preview

Raționament (medium)

Score: 9.25

Consistență: 10.00

Rată de trecere pe încercare: 91.7%

Teste instabile: 0

Cost per rezultat: 2.5543

Teste corecte: 11/12

Cost total: $0.28097

Compară

Comparație rapidă

Compară Qwen: Qwen3.5 Plus 2026-02-15 cu...