AI BENCHY Compare

Qwen: Qwen3 Coder Next vs Xiaomi: MiMo-V2.5-Pro

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-19

Metrik	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03	MiMo-V2.5-Pro MiMo-V2.5-Pro none Veröffentlichung: 2026-04-22

Metrik	Qwen3 Coder Next Qwen3 Coder Next none Veröffentlichung: 2026-02-03	MiMo-V2.5-Pro MiMo-V2.5-Pro none Veröffentlichung: 2026-04-22
Punktzahl	5.2	5.7
Rang	#128	#109
Zuverlässigkeit	10.0	10.0
Konsistenz	9.7	8.4
Korrekte Tests
Erfolgsquote pro Versuch	29.8%	43.9%
Instabile Tests	1	4
Gesamtläufe	57	57
Kosten pro Ergebnis	0.151	0.568
Gesamtkosten	$0.008	$0.035
Eingabepreis	$0.110 / 1M	$1.000 / 1M
Ausgabepreis	$0.800 / 1M	$3.000 / 1M
Ausgabe-Token	3,629	3,040
Denk-Token	0	0
Antwortzeit (Durchschnitt)	9.44s	1.88s
Antwortzeit (Maximum)	45.14s	8.32s
Antwortzeit (Gesamt)	122.73s	35.63s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	994	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0
MiMo-V2.5-Pro	6.4	3.3	66.7%	1		2.39s	452	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	596	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	249	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	27	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	87	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.71s	63	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	66	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	3.0	10.0	0.0%	0		22.86s	652	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.32s	297	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	258	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Qwen3 Coder Next	3.0	10.0	0.0%	0		601ms	12	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	14	0

Schnellvergleich

Vergleichspaar wechseln

gpt-oss-120bmediumKostenlos verfügbarvsMiMo-V2.5-Pronone MiniMax M2.7mediumvsQwen3 Coder Nextnone CobuddymediumKostenlos verfügbarvsMiMo-V2.5-Pronone MiniMax M2.5mediumKostenlos verfügbarvsMiMo-V2.5-Pronone Mistral Small 4mediumvsMiMo-V2.5-Pronone Elephant AlphamediumvsMiMo-V2.5-Pronone Owl AlphamediumvsMiMo-V2.5-Pronone Elephant AlphamediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumKostenlos verfügbarvsQwen3 Coder Nextnone Nemotron 3 SupermediumKostenlos verfügbarvsMiMo-V2.5-Pronone GPT-5 NanomediumvsMiMo-V2.5-Pronone