#126
Moonshot AI
Veröffentlichung: 2026-01-27
Getestet am: 2026-05-22 00:03
moonshotai/kimi-k2.5::none
(medium)
(none)
Eingabepreis
$0.400 / 1M
Ausgabepreis
$1.900 / 1M
Instabile Tests
3
Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).
Testverlauf
| Getestet am | Punktzahl | Zuverlässigkeit | Korrekte Tests | Gesamtkosten | Vergleichen |
|---|---|---|---|---|---|
| 2026-05-22 00:03 Suite geändert | 5.3 | 10.0 | $0.026 | Aktueller Lauf | |
| 2026-04-20 17:48 Erster erfasster Lauf | 5.5 | k. A. | $0.017 | Vergleichen |
Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.
Diagramme
Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.
Punktzahl vs Gesamtkosten
Antwortzeit (Durchschnitt)
Punktzahl vs Antwortzeit (Durchschnitt)
Gesamte Ausgabe-Token
Punktzahl vs Gesamte Ausgabe-Token
Schnellvergleich
Kimi K2.5nonevsMiMo-V2-PrononeKimi K2.5nonevsGLM 4.7 FlashnoneKimi K2.5nonevsOwl AlphanoneKimi K2.5nonevsKimi K2.6noneKimi K2.5nonevsCobuddymediumKostenlos verfügbarKimi K2.5nonevsgpt-oss-120bmediumKostenlos verfügbarKimi K2.5nonevsGemini 3 Flash PreviewmediumKimi K2.5nonevsGemini 3.5 FlashhighKimi K2.5nonevsRing-2.6-1TmediumKimi K2.5nonevsGemini 3.5 Flashlow
Kategorieaufschlüsselung
| Kategorie | Punktzahl | Konsistenz | Korrekte Tests |
|---|---|---|---|
| Anti-KI-Tricks | 3.6 | 8.4 | |
| Programmierung | 6.8 | 10.0 | |
| Kombiniert | 2.8 | 2.1 | |
| Datenanalyse und -extraktion | 7.3 | 5.8 | |
| Domänenspezifisch | 5.3 | 10.0 | |
| Allgemeine Intelligenz | 10.0 | 10.0 | |
| Befolgung von Anweisungen | 6.5 | 10.0 | |
| Rätsellösen | 3.0 | 10.0 | |
| Werkzeugaufrufe | 10.0 | 10.0 | |
| Allgemeinwissen | 3.0 | 10.0 |