Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.5-Flash

Résumé

Comparaison benchmark Claude Sonnet 4.6 vs Qwen3.5-Flash : Claude Sonnet 4.6 mène au score moyen avec 7.3 vs 6.8. Qwen3.5-Flash a le coût de benchmark le plus bas avec $0.080 vs $0.316. Claude Sonnet 4.6 est plus rapide avec 5.04s vs 63.29s, avec des taux de réussite de 55.6% vs 71.4%.

Modèle recommandé: Claude Sonnet 4.6 - Il obtient le meilleur score ici (7.3) et répond environ 12.6x plus vite que Qwen3.5-Flash.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique Claude Sonnet 4.6 Claude Sonnet 4.6 none Sortie: 2026-02-17 Qwen3.5-Flash Qwen3.5-Flash medium Sortie: 2026-02-24
Score 7.3 6.8
Rang #55 #70
Fiabilité 10.0 10.0
Cohérence 9.7 8.1
Tests corrects
Taux de réussite par tentative 55.6% 71.4%
Tests instables 1 5
Exécutions totales 63 63
Coût par résultat 2.870 0.871
Coût total $0.316 $0.080
Prix d'entrée $3.000 / 1M $0.065 / 1M
Prix de sortie $15.000 / 1M $0.260 / 1M
Total des jetons d'entrée 57,886 38,926
Jetons de sortie 9,465 2,088
Jetons de raisonnement 0 294,598
Temps de réponse (moy.) 5.04s 63.29s
Temps de réponse (max) 23.84s 234.29s
Temps de réponse (total) 70.60s 1265.85s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Sonnet 4.6

none
Coût
$0.038
Temps
27.3s
Tokens
2,598 tok

#70 Qwen3.5-Flash

medium
Coût
$0.002
Temps
25.8s
Tokens
4,294 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

Comparaison rapide

Changer la paire de comparaison