#68

Kimi K2.6

Moonshot AI Veröffentlichung: 2026-04-20 Getestet am: 2026-07-16 22:59 moonshotai/kimi-k2.6::medium

(medium) (none)

Zusammenfassung

Kimi K2.6 erreicht 7.2 bei AI BENCHY und liegt auf #68. Das Modell hat 9.4 Zuverlässigkeit, 63.6% Erfolgsrate, $1.036 Gesamtkosten und 109.98s durchschnittliche Antwortzeit.

Punktzahl

7.2

Konsistenz

8.3

Zuverlässigkeit

9.4

Gesamtkosten (aktueller Preis)

$1.036 ↓ -12.1%

Getestet zu: $1.179

Gesamte Ausgabe-Token

391,540

Gesamte Eingabe-Token

68,902

Eingabepreis

$0.684 / 1M

Ausgabepreis

$3.420 / 1M

Korrekte Tests

Falsche Tests: 10

Erfolgsquote pro Versuch: 63.6%

Instabile Tests

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

109.98s

Antwortzeit (Maximum): 876.20s

Antwortzeit (Gesamt): 2309.56s

Zeitüberschreitung: 3 Falsche Antwort: 3 Anweisungen nicht befolgt: 2 Ungültiger Werkzeugaufruf: 1 Keine Antwort: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#68 MoonshotAI: Kimi K2.6

medium

Kosten: $0.013
Zeit: 103.4s
Token: 3,620 tok

Testverlauf

Getestet am	Punktzahl	Zuverlässigkeit	Gesamtkosten	Vergleichen
2026-07-16 22:59 Neuer Test hinzugefügt	7.2	9.4	$1.222 ↑	Aktueller Lauf
2026-06-04 13:59 Neuer Test hinzugefügt	7.2	7.8	$0.891 ↓	Vergleichen
2026-05-22 00:14 Suite geändert	7.4	8.3	$0.916	Vergleichen
2026-04-23 10:54 Erster erfasster Lauf	7.7	k. A.	$0.722	Vergleichen

Dieser Lauf nutzte eine andere Benchmark-Suite. Berücksichtige Suite-Änderungen bei der historischen Einordnung.

Laufvergleich

Lauf	Punktzahl	Konsistenz	Zuverlässigkeit	Korrekte Tests	Instabile Tests	Gesamte Ausgabe-Token	Gesamte Eingabe-Token	Gesamtkosten	Antwortzeit (Durchschnitt)
2026-07-16 22:59 · Aktueller Lauf	7.2	8.3	9.4	12/22	4	391,540	68,902	$1.036	109.98s
2026-05-22 00:14 · Suite geändert	7.4	8.3	8.3	12/20	4	331,877	0	$0.916	54.11s
Differenz	-0.2	0.0	+1.1	0	0	+59663	+68902	+$0.121	+55866ms

Diese beiden Läufe nutzten unterschiedliche Benchmark-Suiten, daher spiegeln die Deltas sowohl Modell- als auch Suite-Änderungen wider.

Preisverlauf

Historische Preisdaten für dieses Modell von OpenRouter.

Datum	Eingabepreis	Ausgabepreis
2026-06-04 15:40	$0.684 / 1M	$3.420 / 1M
2026-06-10 13:42	$0.680 / 1M	$3.410 / 1M
2026-06-29 01:00	$0.660 / 1M	$3.410 / 1M
2026-06-30 21:25	$0.550 / 1M	$3.200 / 1M
2026-07-08 21:00	$0.650 / 1M	$3.410 / 1M
2026-07-16 15:36	$0.950 / 1M	$4.000 / 1M

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kimi K2.6mediumvsClaude Opus 4.8none Kimi K2.6mediumvsGemini 3.1 Flash Litemedium Kimi K2.6mediumvsKAT-Coder-Pro V2.5high Kimi K2.6mediumvsGemini 3.1 Flash Lite Previewmedium Kimi K2.6mediumvsQwen3.5 Plus 2026-04-20medium Kimi K2.6mediumvsGemini 3 Flash Previewmedium Kimi K2.6mediumvsGemini 3.5 Flashhigh Kimi K2.6mediumvsNemotron 3 UltramediumKostenlos verfügbar Kimi K2.6mediumvsGPT-5.5low

Kategorieaufschlüsselung

Kategorie	Punktzahl	Konsistenz
Anti-KI-Tricks	7.0	8.0
Programmierung	5.7	8.6
Kombiniert	6.9	5.9
Datenanalyse und -extraktion	10.0	10.0
Domänenspezifisch	5.3	7.2
Allgemeine Intelligenz	10.0	10.0
Befolgung von Anweisungen	10.0	10.0
Rätsellösen	6.0	7.4
Werkzeugaufrufe	10.0	10.0
Allgemeinwissen	3.0	10.0

Kimi K2.6

Hamster playing table tennis

#68 MoonshotAI: Kimi K2.6

Diagramme

Top-Modelle nach Score

Punktzahl vs Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Schnellvergleich

Kategorieaufschlüsselung

Verglichene Modelle