Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Qwen: Qwen3.7 Max vs Xiaomi: MiMo-V2.5

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-05-22

Metrik Qwen3.7 Max Qwen3.7 Max none Veröffentlichung: 2026-05-22 MiMo-V2.5 MiMo-V2.5 medium Veröffentlichung: 2026-04-22
Punktzahl 7.9 7.8
Rang #27 #30
Zuverlässigkeit 10.0 10.0
Konsistenz 10.0 8.6
Korrekte Tests
Erfolgsquote pro Versuch 70.0% 75.9%
Instabile Tests 0 3
Gesamtläufe 60 54
Kosten pro Ergebnis 0.719 2.101
Gesamtkosten $0.101 $0.253
Eingabepreis $2.500 / 1M $0.400 / 1M
Ausgabepreis $7.500 / 1M $2.000 / 1M
Ausgabe-Token 1,988 2,821
Denk-Token 0 116,207
Antwortzeit (Durchschnitt) 1.30s 14.40s
Antwortzeit (Maximum) 3.92s 86.93s
Antwortzeit (Gesamt) 25.95s 259.20s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 6.5 10.0 50.0% 0 1.08s 242 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
Programmierung Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 6.8 10.0 50.0% 0 1.39s 576 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 3.0 10.0 0.0% 0 2.17s 171 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 10.0 10.0 100.0% 0 1.35s 243 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 7.7 10.0 66.7% 0 975ms 15 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 10.0 10.0 100.0% 0 1.04s 120 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 10.0 10.0 100.0% 0 943ms 72 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
Rätsellösen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 10.0 10.0 100.0% 0 1.13s 314 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 10.0 10.0 100.0% 0 3.92s 222 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
Allgemeinwissen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Qwen3.7 Max 3.0 10.0 0.0% 0 856ms 13 0
MiMo-V2.5 - - - - - - - -

Schnellvergleich

Vergleichspaar wechseln