AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#37

Qwen3.6 27B

Qwen Sortie: 2026-04-20 Testé le: 2026-04-27 21:31 qwen/qwen3.6-27b::medium
(medium) (none)

Résumé

Qwen3.6 27B obtient 7.9 sur AI BENCHY et se classe #37. Il affiche une fiabilité de 10.0, un taux de réussite de 77.8%, un coût total de $0.043 et un temps de réponse moyen de 25.56s.

Score

7.9

Cohérence

8.5

Fiabilité

10.0

Total des jetons de sortie

21,553

Total des jetons d'entrée

0

Prix d'entrée

$0.500 / 1M

Prix de sortie

$2.000 / 1M

Tests corrects

Tests incorrects: 2

Taux de réussite par tentative: 77.8%

Tests instables

1

Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).

Temps de réponse (moy.)

25.56s

Temps de réponse (max): 47.48s

Temps de réponse (total): 153.33s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

Historique des runs

Testé le Score Fiabilité Tests corrects Coût total Comparer
2026-06-04 13:21 Nouveau test ajouté 6.8 10.0 $0.444 Comparer
2026-05-21 23:59 Suite modifiée 6.6 9.9 $0.272 Comparer
2026-04-27 21:48 Nouveau test ajouté 7.0 10.0 $0.209 Comparer
2026-04-27 21:31 Première exécution enregistrée 7.9 10.0 $0.043 Exécution actuelle

Comparaison de runs

RunScoreCohérenceFiabilitéTests correctsTests instablesTotal des jetons de sortieTotal des jetons d'entréeCoût totalTemps de réponse (moy.)
2026-04-27 21:31 · Première exécution enregistrée7.98.510.04/6121,5530$0.04325.56s
2026-04-27 21:48 · Nouveau test ajouté7.07.910.09/18599,3620$0.20950.53s
Différence+0.9+0.60.0-5-4-778090-$0.166-24972ms

Ces deux runs ont utilisé des suites de benchmark différentes, donc les écarts reflètent à la fois les changements du modèle et ceux de la suite.

Graphiques

Choisissez d'abord le premier modèle, puis cliquez sur un second modèle pour ouvrir une page côte à côte.

Total des jetons de sortie

Score vs Total des jetons de sortie

Comparaison rapide

Répartition par catégorie

Catégorie Score Cohérence Tests corrects
Astuces anti-IA 10.0 10.0
Analyse et extraction des données 4.3 1.2
Spécifique au domaine 3.0 10.0
Suivi des instructions 10.0 10.0
Appel d'outils 10.0 10.0

Modèles comparés