Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs xAI: Grok 4.1 Fast

Nom du modèle:

Benchmarks générés à partir des suites de tests AI BENCHY le : 2026-02-27 15:16

Résumé

Métrique	Qwen: Qwen3.5 Plus 2026-02-15 none Sortie: Date de sortie inconnue	xAI: Grok 4.1 Fast medium Sortie: Date de sortie inconnue
Rang	#15	#16
Score	6.29	6.29
Cohérence	9.99	8.20
Coût par résultat	0.139	0.532
Coût total	$0.012	$0.043
Tests corrects
Tests incorrects	6	6
Taux de réussite par tentative	57.1%	66.7%
Tests instables	0	3
Jetons de sortie	1,499	793
Jetons de raisonnement	0	74,056

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		514	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		102	4,021

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		243	0
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	5,472

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		15	0
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		12	40,547

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	9.50	10.00	100.0%	0		71	0
xAI: Grok 4.1 Fast	5.50	10.00	50.0%	0		48	3,151

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	5.00	9.96	33.3%	0		434	0
xAI: Grok 4.1 Fast	4.67	7.20	44.4%	1		191	9,380

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		222	0
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		260	11,485

Changer la paire de comparaison

Comparer Qwen: Qwen3.5 Plus 2026-02-15 à...

Comparer xAI: Grok 4.1 Fast à...