Comparer Graphiques

Langue:

❤️ Made by XCS

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs xAI: Grok 4.1 Fast

Nom du modèle:

Benchmarks générés à partir des suites de tests AI BENCHY le : 2026-02-27 15:16

Résumé

Métrique	MiniMax: MiniMax M2.5 medium Sortie: Date de sortie inconnue	xAI: Grok 4.1 Fast none Sortie: Date de sortie inconnue
Rang	#26	#38
Score	5.64	3.00
Cohérence	6.12	8.69
Coût par résultat	4.028	0.176
Coût total	$0.242	$0.006
Tests corrects
Tests incorrects	8	11
Taux de réussite par tentative	64.3%	28.6%
Tests instables	7	2
Jetons de sortie	121,297	931
Jetons de raisonnement	203,513	0

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	9.33	7.89	88.9%	1		286	45,112
xAI: Grok 4.1 Fast	1.33	10.00	0.0%	0		229	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	5.50	5.81	83.3%	1		369	4,952
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	1.00	4.41	22.2%	2		111,023	139,533
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		15	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	7.00	6.41	66.7%	1		1,121	2,521
xAI: Grok 4.1 Fast	1.00	10.00	0.0%	0		66	0

Puzzle Solving	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	4.33	4.79	55.6%	2		8,229	10,458
xAI: Grok 4.1 Fast	1.00	9.48	0.0%	0		233	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Jetons de sortie	Jetons de raisonnement
MiniMax: MiniMax M2.5	10.00	10.00	100.0%	0		269	937
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		208	0

Changer la paire de comparaison

Comparer MiniMax: MiniMax M2.5 à...

Comparer xAI: Grok 4.1 Fast à...