#62

MiMo-V2-Omni

Xiaomi Veröffentlichung: 2026-03-18 Getestet am: 2026-05-08 15:32 xiaomi/mimo-v2-omni::medium

(medium) (none)

Punktzahl

7.2

Konsistenz

9.1

Zuverlässigkeit

10.0

Gesamtkosten

$0.451

Gesamte Ausgabe-Token

218,577

Eingabepreis

$0.400 / 1M

Ausgabepreis

$2.000 / 1M

Korrekte Tests

Falsche Tests: 9

Erfolgsquote pro Versuch: 59.7%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

27.58s

Antwortzeit (Maximum): 234.19s

Antwortzeit (Gesamt): 524.03s

Falsche Antwort: 5 Anweisungen nicht befolgt: 2 Zusätzliche Formatierung: 1 Keine Antwort: 1

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-05-22 00:27 Suite geändert	6.9	10.0	$0.734	Vergleichen
2026-05-08 15:32 Suite geändert	7.2	10.0	$0.451	Aktueller Lauf
2026-04-11 01:44 Erster erfasster Lauf	7.7	k. A.	$0.153	Vergleichen

Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Instabile Tests	Gesamte Ausgabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-05-08 15:32 · Suite geändert	7.2	9.1	10.0	10/19	2	218,577	$0.451	27.58s
2026-04-11 01:44 · Erster erfasster Lauf	7.7	9.9	k. A.	11/18	0	73,589	$0.153	16.76s
Differenz	-0.5	-0.8		-1	+2	+144988	+$0.299	+10825ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

MiMo-V2-OmnimediumvsRing-2.6-1Tnone MiMo-V2-OmnimediumvsGPT-5.4 Nanomedium MiMo-V2-OmnimediumvsRing-2.6-1Tmedium MiMo-V2-OmnimediumvsGPT-5.4 Minimedium MiMo-V2-OmnimediumvsGLM 5V Turbomedium MiMo-V2-OmnimediumvsQwen3.6 Max Previewnone MiMo-V2-OmnimediumvsGemini 3 Flash Previewmedium MiMo-V2-OmnimediumvsGemini 3.5 Flashhigh MiMo-V2-OmnimediumvsGemini 3.5 Flashlow

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	10.0	10.0
Programmierung	4.0	7.9
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	3.0	10.0
Allgemeine Intelligenz	5.4	2.5
Befolgung von Anweisungen	8.3	10.0
Rätsellösen	5.9	7.2
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

MiMo-V2-Omni

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle