Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Qwen: Qwen3.6 27B

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-04

Métrique Claude Opus 4.8 Claude Opus 4.8 none Sortie: 2026-05-28 Qwen3.6 27B Qwen3.6 27B medium Sortie: 2026-04-20
Score 7.0 6.8
Rang #68 #78
Fiabilité 10.0 10.0
Cohérence 9.2 8.2
Tests corrects
Taux de réussite par tentative 61.9% 60.3%
Tests instables 2 5
Exécutions totales 63 63
Coût par résultat 4.485 3.361
Coût total $0.539 $0.444
Prix d'entrée $5.000 / 1M $0.290 / 1M
Prix de sortie $25.000 / 1M $3.200 / 1M
Total des jetons d'entrée 67,104 39,376
Jetons de sortie 8,107 16,189
Jetons de raisonnement 0 122,521
Temps de réponse (moy.) 3.47s 59.71s
Temps de réponse (max) 17.73s 168.22s
Temps de réponse (total) 72.90s 1254.01s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 834 1,472 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 5.5 10.0 33.3% 0 3.29s 10,590 1,332 0
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 29,658 3,259 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 10,503 308 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 975 61 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 708 230 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 909 95 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 894 783 0
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 11,775 355 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 258 212 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807

Comparaison rapide

Changer la paire de comparaison