AI BENCHY Compare

Owl Alpha vs Xiaomi: MiMo-V2-Omni

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-08

Metrik	Owl Alpha Owl Alpha medium Veröffentlichung: 2026-04-30	MiMo-V2-Omni MiMo-V2-Omni none Veröffentlichung: 2026-03-18

Metrik	Owl Alpha Owl Alpha medium Veröffentlichung: 2026-04-30	MiMo-V2-Omni MiMo-V2-Omni none Veröffentlichung: 2026-03-18
Punktzahl	6.0	6.3
Rang	#88	#79
Zuverlässigkeit	10.0	10.0
Konsistenz	9.6	9.7
Korrekte Tests
Erfolgsquote pro Versuch	43.9%	43.9%
Instabile Tests	1	1
Gesamtläufe	57	49
Kosten pro Ergebnis	0.000	0.241
Gesamtkosten	$0.000	$0.020
Eingabepreis	$0.000 / 1M	$0.400 / 1M
Ausgabepreis	$0.000 / 1M	$2.000 / 1M
Ausgabe-Token	1,613	2,254
Denk-Token	0	0
Antwortzeit (Durchschnitt)	10.58s	2.37s
Antwortzeit (Maximum)	58.63s	6.81s
Antwortzeit (Gesamt)	201.03s	45.03s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	4.8	10.0	25.0%	0		3.97s	87	0
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	10.0	10.0	100.0%	0		7.35s	402	0
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	3.0	10.0	0.0%	0		10.01s	315	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	10.0	10.0	100.0%	0		21.64s	246	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	5.3	10.0	33.3%	0		8.58s	28	0
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	4.3	10.0	0.0%	0		58.63s	98	0
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	6.3	10.0	50.0%	0		9.59s	57	0
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	5.3	7.2	44.4%	1		3.44s	135	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	10.0	10.0	100.0%	0		8.26s	228	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Ausgabe-Token	Denk-Token
Owl Alpha	3.0	10.0	0.0%	0		2.38s	17	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Schnellvergleich

Vergleichspaar wechseln

Owl AlphamediumvsQwen3.5-Flashnone Owl AlphamediumvsGLM 5V Turbonone Seed-2.0-LitenonevsOwl Alphamedium Mercury 2mediumvsMiMo-V2-Omninone Owl AlphamediumvsQwen3.5 Plus 2026-04-20none Owl AlphamediumvsQwen3.5-35B-A3Bnone GPT-5 NanomediumvsMiMo-V2-Omninone Owl AlphamediumvsMiMo-V2-Pronone Grok 4.1 FastmediumvsMiMo-V2-Omninone Owl AlphamediumvsQwen3.5-27Bnone Owl AlphamediumvsQwen3.6 27Bnone DeepSeek V4 PrononevsOwl Alphamedium