Claude Sonnet 4.6 vs MiMo-V2.5-Pro (medium)

Empfohlenes Modell Claude Sonnet 4.6

Es hat hier die beste Punktzahl (7.3) und antwortet etwa 4.2x schneller als MiMo-V2.5-Pro (medium).

Detaillierter Vergleich

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 none Veröffentlichung: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Veröffentlichung: 2026-04-22

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 none Veröffentlichung: 2026-02-17	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Veröffentlichung: 2026-04-22
Punktzahl	7.3	6.9
Rang	#71	#92
Zuverlässigkeit	10.0	10.0
Konsistenz	9.7	8.2
Korrekte Tests
Erfolgsquote pro Versuch	57.6%	66.7%
Instabile Tests	1	5
Gesamtläufe	66	66
Kosten pro Ergebnis	5.502	3.218
Gesamtkosten	$0.661	$0.187
Eingabepreis	$3.000 / 1M	$0.435 / 1M
Ausgabepreis	$15.000 / 1M	$0.870 / 1M
Gesamte Eingabe-Token	123,264	139,883
Ausgabe-Token	19,362	15,521
Denk-Token	0	130,992
Antwortzeit (Durchschnitt)	8.12s	33.92s
Antwortzeit (Maximum)	51.18s	197.54s
Antwortzeit (Gesamt)	121.78s	746.19s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Ungültiges SVG

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Vergleichspaar wechseln