AI BENCHY
Vergleichen
❤️ Made by XCS

Modellname

MiniMax: MiniMax M2.5

Benchmarks aus Aibenchy-Test-Suites generiert am : 19.02.2026

Metrik MiniMax: MiniMax M2.5
Rang#17
UnternehmenMiniMax
Score 5.08
Konsistenz 6.00
Kosten pro Ergebnis 4.0276
Gesamtkosten $0.20138
Korrekte Tests 5/12
Erfolgsquote pro Versuch 61.1%
Instabile Tests 6
Ausgabe-Token 121,028
Denk-Token 165,110

Kategorieaufschlüsselung

Kategorie Vollständig bestandene Tests Score Konsistenz Erfolgsquote pro Versuch Instabile Tests Begründungswert Kosten
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

Verglichene Modelle

MiniMax: MiniMax M2.5 vergleichen mit...

#16 · Anthropic

Anthropic: Claude Opus 4.6

Schlussfolgern (medium)

Score: 5.42

Konsistenz: 8.60

Erfolgsquote pro Versuch: 55.5%

Instabile Tests: 2

Kosten pro Ergebnis: 12.8695

Korrekte Tests: 6/12

Gesamtkosten: $0.77217

Vergleichen

#18 · Stepfun

StepFun: Step 3.5 Flash

Schlussfolgern (medium)

Score: 4.92

Konsistenz: 7.34

Erfolgsquote pro Versuch: 58.3%

Instabile Tests: 4

Kosten pro Ergebnis: 0.0000

Korrekte Tests: 5/12

Gesamtkosten: $0.00000

Vergleichen

#15 · Z.ai

Z.ai: GLM 5

Ohne Schlussfolgern

Score: 5.42

Konsistenz: 10.00

Erfolgsquote pro Versuch: 50.0%

Instabile Tests: 0

Kosten pro Ergebnis: 0.0704

Korrekte Tests: 6/12

Gesamtkosten: $0.00423

Vergleichen

Schnellvergleich

MiniMax: MiniMax M2.5 vergleichen mit...