Vergleichen Diagramme

Sprache:

❤️ Made by XCS

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs xAI: Grok 4.1 Fast

Modellname:

Benchmarks aus AI BENCHY-Test-Suites generiert am : 2026-02-27 15:16

Zusammenfassung

Metrik	MiniMax: MiniMax M2.5 medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum	xAI: Grok 4.1 Fast medium Veröffentlichung: Unbekanntes Veröffentlichungsdatum
Rang	#26	#16
Punktzahl	5.64	6.29
Konsistenz	6.12	8.20
Kosten pro Ergebnis	4.028	0.532
Gesamtkosten	$0.242	$0.043
Korrekte Tests
Falsche Tests	8	6
Erfolgsquote pro Versuch	64.3%	66.7%
Instabile Tests	7	3
Ausgabe-Token	121,297	793
Denk-Token	203,513	74,056

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	9.33	7.89	88.9%	1		286	45,112
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		102	4,021

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	5.50	5.81	83.3%	1		369	4,952
xAI: Grok 4.1 Fast	10.00	10.00	100.0%	0		180	5,472

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	1.00	4.41	22.2%	2		111,023	139,533
xAI: Grok 4.1 Fast	4.00	7.21	55.6%	1		12	40,547

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	7.00	6.41	66.7%	1		1,121	2,521
xAI: Grok 4.1 Fast	5.50	10.00	50.0%	0		48	3,151

Puzzle Solving	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	4.33	4.79	55.6%	2		8,229	10,458
xAI: Grok 4.1 Fast	4.67	7.20	44.4%	1		191	9,380

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Ausgabe-Token	Denk-Token
MiniMax: MiniMax M2.5	10.00	10.00	100.0%	0		269	937
xAI: Grok 4.1 Fast	1.00	1.62	33.3%	1		260	11,485

Vergleichspaar wechseln

MiniMax: MiniMax M2.5 vergleichen mit...

xAI: Grok 4.1 Fast vergleichen mit...