AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 Max Preview

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-27

Métrique	Claude Opus 4.7 Claude Opus 4.7 medium Sortie: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview none Sortie: 2026-04-20

Métrique	Claude Opus 4.7 Claude Opus 4.7 medium Sortie: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview none Sortie: 2026-04-20
Score	9.2	7.3
Rang	#3	#56
Fiabilité	N/D	10.0
Cohérence	10.0	8.7
Tests corrects
Taux de réussite par tentative	88.9%	66.7%
Tests instables	0	3
Exécutions totales	54	54
Coût par résultat	2.790	0.827
Coût total	$0.447	$0.083
Prix d'entrée	$5.000 / 1M	$1.300 / 1M
Prix de sortie	$25.000 / 1M	$7.800 / 1M
Jetons de sortie	5,375	4,732
Jetons de raisonnement	1,341	0
Temps de réponse (moy.)	3.53s	3.38s
Temps de réponse (max)	21.45s	20.51s
Temps de réponse (total)	60.03s	60.83s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	348	0
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		6.41s	1,141	257
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	2,369	1,084
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	324	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	51	0
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	256	0
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	114	0
Qwen3.6 Max Preview	8.4	6.9	83.3%	1		1.45s	69	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		2.51s	399	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	373	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0

Comparaison rapide

Changer la paire de comparaison

GPT-5.4 MinimediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium GPT-5.2mediumvsQwen3.6 Max Previewnone Seed-2.0-MinimediumvsQwen3.6 Max Previewnone Claude Opus 4.7mediumvsGPT-5.5low GPT-5.4 NanomediumvsQwen3.6 Max Previewnone Claude Opus 4.6mediumvsQwen3.6 Max Previewnone GPT-5 MinimediumvsQwen3.6 Max Previewnone Kimi K2.5mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Qwen3.6 Max PreviewnonevsGrok 4.20medium Kimi K2.6mediumvsQwen3.6 Max Previewnone