#40

MiMo-V2-Omni

Xiaomi Veröffentlichung: 2026-03-18 Getestet am: 2026-04-11 01:44 xiaomi/mimo-v2-omni::medium

(medium) (none)

Punktzahl

7.7

Konsistenz

9.9

Zuverlässigkeit

k. A.

Gesamtkosten

$0.153

Gesamte Ausgabe-Token

73,589

Eingabepreis

$0.400 / 1M

Ausgabepreis

$2.000 / 1M

Korrekte Tests

Falsche Tests: 7

Erfolgsquote pro Versuch: 61.1%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

16.76s

Antwortzeit (Maximum): 158.78s

Antwortzeit (Gesamt): 301.61s

Falsche Antwort: 3 Anweisungen nicht befolgt: 2 Zusätzliche Formatierung: 1 Keine Antwort: 1

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-05-22 00:27 Suite geändert	6.9	10.0	$0.734	Vergleichen
2026-05-08 15:32 Suite geändert	7.2	10.0	$0.451	Vergleichen
2026-04-11 01:44 Erster erfasster Lauf	7.7	k. A.	$0.153	Aktueller Lauf

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Instabile Tests	Gesamte Ausgabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-04-11 01:44 · Erster erfasster Lauf	7.7	9.9	k. A.	11/18	0	73,589	$0.153	16.76s
2026-05-08 15:32 · Suite geändert	7.2	9.1	10.0	10/19	2	218,577	$0.451	27.58s
Differenz	+0.5	+0.8		+1	-2	-144988	-$0.299	-10825ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

MiMo-V2-OmnimediumvsRing-2.6-1Tnone MiMo-V2-OmnimediumvsGPT-5.4 Nanomedium MiMo-V2-OmnimediumvsRing-2.6-1Tmedium MiMo-V2-OmnimediumvsGPT-5.4 Minimedium MiMo-V2-OmnimediumvsGLM 5V Turbomedium MiMo-V2-OmnimediumvsQwen3.6 Max Previewnone MiMo-V2-OmnimediumvsGemini 3 Flash Previewmedium MiMo-V2-OmnimediumvsGemini 3.5 Flashhigh MiMo-V2-OmnimediumvsGemini 3.5 Flashlow

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	10.0	10.0
Programmierung	4.0	7.9
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	3.0	10.0
Allgemeine Intelligenz	10.0	10.0
Befolgung von Anweisungen	8.3	10.0
Rätsellösen	6.5	10.0
Werkzeugaufrufe	10.0	10.0

MiMo-V2-Omni

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle