#40

Kimi K2.5

Moonshot AI · Veröffentlichung: 2026-01-27 · moonshotai/kimi-k2.5::medium

7.2

Konsistenz

7.2

$0.201

Gesamte Ausgabe-Token

116,028

Eingabepreis

$0.383 / 1M

Ausgabepreis

$1.720 / 1M

Falsche Tests: 8

Erfolgsquote pro Versuch: 72.6%

Instabile Tests

6

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

64.59s

Antwortzeit (Maximum): 137.29s

Antwortzeit (Gesamt): 645.93s

Falsche Antwort: 4 Anweisungen nicht befolgt: 2 Keine Antwort: 1 Zeitüberschreitung: 1

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kimi K2.5mediumvsQwen3.5-35B-A3Bmedium Kimi K2.5mediumvsGPT-5.2medium Kimi K2.5mediumvsGrok 4.20medium Kimi K2.5mediumvsSeed-2.0-Minimedium Kimi K2.5mediumvsGPT-5.4 Minimedium Kimi K2.5mediumvsGemini 3 Flash Previewmedium Kimi K2.5mediumvsGemini 3.1 Pro Previewmedium Kimi K2.5mediumvsQwen3.6 Plus Previewmedium

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz	Korrekte Tests
Anti-KI-Tricks	7.3	5.8
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	3.5	4.4
Allgemeine Intelligenz	6.5	3.4
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	5.3	7.3
Werkzeugaufrufe	10.0	10.0

Verglichene Modelle