Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

Verglichene Modelle

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-04

Metrik Hunter Alpha Hunter Alpha medium Veröffentlichung: 2026-03-11 MiMo-V2-Pro MiMo-V2-Pro medium Veröffentlichung: 2026-03-18 MiMo-V2-Omni MiMo-V2-Omni medium Veröffentlichung: 2026-03-18
Punktzahl 7.0 8.0 7.9
Rang #43 #24 #26
Konsistenz 7.2 8.5 10.0
Korrekte Tests
Erfolgsquote pro Versuch 68.6% 76.5% 64.7%
Instabile Tests 6 3 0
Gesamtläufe 51 45 17
Kosten pro Ergebnis 0.000 1.110 0.763
Gesamtkosten $0.000 $0.123 $0.084
Eingabepreis $0.000 / 1M $1.000 / 1M $0.400 / 1M
Ausgabepreis $0.000 / 1M $3.000 / 1M $2.000 / 1M
Ausgabe-Token 4,724 1,875 663
Denk-Token 17,921 26,959 39,001
Antwortzeit (Durchschnitt) 10.33s 9.78s 13.71s
Antwortzeit (Maximum) 30.53s 64.71s 158.78s
Antwortzeit (Gesamt) 175.60s 156.45s 233.06s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 7.3 5.8 83.3% 2 4.75s 479 1,103
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.06s 223 1,107
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 4.7 1.6 66.7% 1 30.53s 792 3,456
MiMo-V2-Pro 4.7 1.6 66.7% 1 64.71s 380 14,186
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 10.0 10.0 100.0% 0 23.16s 1,488 8,017
MiMo-V2-Pro 7.3 5.8 83.3% 1 17.20s 260 7,484
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 3.0 10.0 0.0% 0 10.52s 892 2,406
MiMo-V2-Pro 5.3 10.0 33.3% 0 6.00s 155 1,048
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 7.0 3.7 66.7% 1 6.44s 116 260
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.06s 198 424
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 9.9 10.0 100.0% 0 4.18s 208 465
MiMo-V2-Pro 9.9 10.0 100.0% 0 3.36s 83 667
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
Puzzle Solving Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 6.1 4.7 66.7% 2 5.36s 441 1,310
MiMo-V2-Pro 7.0 7.2 55.6% 1 4.71s 313 1,179
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Hunter Alpha 10.0 10.0 100.0% 0 17.33s 308 904
MiMo-V2-Pro 10.0 10.0 100.0% 0 8.19s 263 864
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

Schnellvergleich

Vergleichspaar wechseln