AI BENCHY
Comparer
❤️ Made by XCS

Nom du modèle

OpenAI: gpt-oss-120b

Benchmarks générés à partir des suites de tests Aibenchy le : 19 févr. 2026

Métrique OpenAI: gpt-oss-120b
Rang#12
EntrepriseOpenAI
Score 5.75
Cohérence 7.19
Coût par résultat 0.0951
Coût total $0.00571
Tests corrects 6/12
Taux de réussite par tentative 63.9%
Tests instables 4
Jetons de sortie 8,060
Jetons de raisonnement 23,792

Répartition par catégorie

Catégorie Tests entièrement réussis Score Cohérence Taux de réussite par tentative Tests instables Score de raisonnement Coût
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 10.00 $0.00029
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 10.00 $0.00052
Domain specific 0/3 1.00 4.41 22.2% 2 8.53 $0.00393
Instructions following 2/2 10.00 10.00 100.0% 0 9.50 $0.00040
Puzzle Solving 1/3 5.00 7.13 44.4% 1 7.89 $0.00059

Modèles comparés

Comparer OpenAI: gpt-oss-120b à...

#11 · OpenAI

OpenAI: GPT-5 Nano

Raisonnement (medium)

Score: 5.92

Cohérence: 6.03

Taux de réussite par tentative: 72.2%

Tests instables: 6

Coût par résultat: 0.4675

Tests corrects: 6/12

Coût total: $0.02806

Comparer

#13 · Anthropic

Anthropic: Claude Sonnet 4.6

Sans raisonnement

Score: 5.75

Cohérence: 9.42

Taux de réussite par tentative: 52.8%

Tests instables: 1

Coût par résultat: 0.9480

Tests corrects: 6/12

Coût total: $0.05688

Comparer

#10 · Google

Google: Gemini 3 Flash Preview

Sans raisonnement

Score: 6.25

Cohérence: 8.60

Taux de réussite par tentative: 66.7%

Tests instables: 2

Coût par résultat: 0.0754

Tests corrects: 7/12

Coût total: $0.00528

Comparer

Comparaison rapide

Comparer OpenAI: gpt-oss-120b à...