AI BENCHY
Your ad here

#37

Qwen3.6 27B

Qwen Sortie: 2026-04-20 Testé le: 2026-04-27 21:31 qwen/qwen3.6-27b::medium
(medium) (none)

Score

7.9

Cohérence

8.5

Fiabilité

10.0

Coût total

$0.043

Total des jetons de sortie

21,553

Prix d'entrée

$0.500 / 1M

Prix de sortie

$2.000 / 1M

Tests corrects

Tests incorrects: 2

Taux de réussite par tentative: 77.8%

Tests instables

1

Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).

Temps de réponse (moy.)

25.56s

Temps de réponse (max): 47.48s

Temps de réponse (total): 153.33s

Historique des runs

Testé le Score Fiabilité Tests corrects Coût total Comparer
2026-04-27 21:48 Nouveau test ajouté 7.0 10.0 $0.209 Comparer
2026-04-27 21:31 Première exécution enregistrée 7.9 10.0 $0.043 Exécution actuelle

Comparaison de runs

RunScoreCohérenceFiabilitéTests correctsTests instablesTotal des jetons de sortieCoût totalTemps de réponse (moy.)
2026-04-27 21:31 · Première exécution enregistrée7.98.510.04/6121,553$0.04325.56s
2026-04-27 21:48 · Nouveau test ajouté7.07.910.09/18599,362$0.20950.53s
Différence+0.9+0.60.0-5-4-77809-$0.166-24972ms

Ces deux runs ont utilisé des suites de benchmark différentes, donc les écarts reflètent à la fois les changements du modèle et ceux de la suite.

Graphiques

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Total des jetons de sortie

Score vs Total des jetons de sortie

Comparaison rapide

Répartition par catégorie

Catégorie Score Cohérence Tests corrects
Astuces anti-IA 10.0 10.0
Analyse et extraction des données 4.3 1.2
Spécifique au domaine 3.0 10.0
Suivi des instructions 10.0 10.0
Appel d'outils 10.0 10.0

Modèles comparés