Navigation
AI BENCHY
Comparer Graphiques
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-05

Métrique OpenAI: GPT-5.4 none Sortie: 2026-03-05 Qwen: Qwen3.5-27B none Sortie: 2026-02-24
Rang #44 #41
Score moy. 4.6 4.9
Tests corrects
Cohérence 8.9 9.0
Coût par résultat 1.496 0.297
Coût total $0.090 $0.015
Taux de réussite par tentative 44.4% 40.0%
Tests instables 2 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 1,635 3,035
Jetons de raisonnement 0 0
Temps de réponse (moy.) 1.46s 1.70s
Temps de réponse (max) 2.89s 9.39s
Temps de réponse (total) 21.86s 25.55s

Meilleurs modèles par score

Temps de réponse (moy.)

Score vs coût total

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3.5-27B 4.0 10.0 33.3% 0 796ms 264 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3.5-27B 10.0 1.6 33.3% 1 9.39s 1,461 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3.5-27B 9.9 10.0 100.0% 0 1.43s 243 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3.5-27B 10.0 10.0 0.0% 0 540ms 15 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3.5-27B 4.5 10.0 0.0% 0 815ms 69 0
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3.5-27B 6.3 7.9 55.6% 1 1.37s 680 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0

Comparaison rapide

Changer la paire de comparaison