AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5-27B

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-26

Métrique	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24

Métrique	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement	Qwen3.5-27B Qwen3.5-27B none Sortie: 2026-02-24
Score	5.4	5.8
Rang	#119	#106
Fiabilité	10.0	10.0
Cohérence	9.1	9.3
Tests corrects
Taux de réussite par tentative	38.6%	40.0%
Tests instables	2	2
Exécutions totales	133	136
Coût par résultat	0.302	0.509
Coût total	$0.019	$0.036
Prix d'entrée	$0.000 / 1M	$0.195 / 1M
Prix de sortie	$0.000 / 1M	$1.560 / 1M
Jetons de sortie	91,564	10,539
Jetons de raisonnement	0	0
Temps de réponse (moy.)	21.61s	1.69s
Temps de réponse (max)	113.71s	9.39s
Temps de réponse (total)	345.79s	33.82s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	267	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0
Qwen3.5-27B	7.3	10.0	50.0%	0		1.98s	408	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	1,461	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	243	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	15	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	126	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	10,870	0
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	791	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	34,952	0
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	6,915	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	10	0

Comparaison rapide

Changer la paire de comparaison

MiniMax M2.5mediumDisponible gratuitementvsgpt-oss-120bnoneDisponible gratuitement CobuddymediumDisponible gratuitementvsQwen3.5-27Bnone Mistral Small 4mediumvsgpt-oss-120bnoneDisponible gratuitement gpt-oss-120bnoneDisponible gratuitementvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneDisponible gratuitement Owl AlphamediumvsQwen3.5-27Bnone gpt-oss-120bmediumDisponible gratuitementvsQwen3.5-27Bnone Nemotron 3 SupermediumDisponible gratuitementvsQwen3.5-27Bnone CobuddymediumDisponible gratuitementvsgpt-oss-120bnoneDisponible gratuitement MiniMax M2.5mediumDisponible gratuitementvsQwen3.5-27Bnone GPT-5 NanomediumvsQwen3.5-27Bnone Mistral Small 4mediumvsQwen3.5-27Bnone