AI BENCHY
Comparer
❤️ Made by XCS

Nom du modèle

Qwen: Qwen3.5 Plus 2026-02-15

Benchmarks générés à partir des suites de tests Aibenchy le : 19 févr. 2026

Métrique Qwen: Qwen3.5 Plus 2026-02-15
Rang#4
EntrepriseQwen
Score 8.42
Cohérence 9.30
Coût par résultat 2.3151
Coût total $0.23151
Tests corrects 10/12
Taux de réussite par tentative 86.1%
Tests instables 1
Jetons de sortie 802
Jetons de raisonnement 93,972

Répartition par catégorie

Catégorie Tests entièrement réussis Score Cohérence Taux de réussite par tentative Tests instables Score de raisonnement Coût
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.17 $0.00855
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.61 $0.03952
Domain specific 1/3 4.00 7.21 44.4% 1 7.28 $0.10564
Instructions following 2/2 9.50 9.99 100.0% 0 9.33 $0.02275
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.28 $0.05508

Modèles comparés

Comparer Qwen: Qwen3.5 Plus 2026-02-15 à...

#3 · Google

Google: Gemini 3 Pro Preview

Raisonnement (medium)

Score: 8.42

Cohérence: 10.00

Taux de réussite par tentative: 83.3%

Tests instables: 0

Coût par résultat: 0.8028

Tests corrects: 10/12

Coût total: $0.08029

Comparer

#5 · OpenAI

OpenAI: GPT-5.2

Raisonnement (medium)

Score: 7.92

Cohérence: 9.30

Taux de réussite par tentative: 80.6%

Tests instables: 1

Coût par résultat: 2.2838

Tests corrects: 9/12

Coût total: $0.20554

Comparer

#2 · Google

Google: Gemini 3.1 Pro Preview

Raisonnement (medium)

Score: 9.25

Cohérence: 10.00

Taux de réussite par tentative: 91.7%

Tests instables: 0

Coût par résultat: 2.5543

Tests corrects: 11/12

Coût total: $0.28097

Comparer

Comparaison rapide

Comparer Qwen: Qwen3.5 Plus 2026-02-15 à...