Kimi K2.6 (medium) vs Grok 4.3 (medium)

Empfohlenes Modell Grok 4.3 (medium)

Die Punktzahl bleibt nah an der besten hier (7.1 vs 7.2) und es antwortet etwa 2.3x schneller als Kimi K2.6 (medium).

Detaillierter Vergleich

Metrik	Kimi K2.6 Kimi K2.6 medium Veröffentlichung: 2026-04-20	Grok 4.3 Grok 4.3 medium Veröffentlichung: 2026-05-01

Metrik	Kimi K2.6 Kimi K2.6 medium Veröffentlichung: 2026-04-20	Grok 4.3 Grok 4.3 medium Veröffentlichung: 2026-05-01
Punktzahl	7.2	7.1
Rang	#78	#83
Zuverlässigkeit	9.4	10.0
Konsistenz	8.3	8.6
Korrekte Tests
Erfolgsquote pro Versuch	63.6%	68.2%
Instabile Tests	4	4
Gesamtläufe	66	66
Kosten pro Ergebnis	9.821	5.990
Gesamtkosten	$0.831	$0.779
Eingabepreis	$0.646 / 1M	$1.250 / 1M
Ausgabepreis	$2.720 / 1M	$2.500 / 1M
Gesamte Eingabe-Token	68,902	140,031
Ausgabe-Token	111,680	13,739
Denk-Token	279,860	227,682
Antwortzeit (Durchschnitt)	109.98s	47.45s
Antwortzeit (Maximum)	876.20s	216.69s
Antwortzeit (Gesamt)	2309.56s	1043.83s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	7.0	8.0	66.7%	1		11.59s	618	7,115	8,934
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	5.7	8.6	33.3%	0		214.42s	2,925	9,970	77,189
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	6.9	5.9	66.7%	1		458.58s	50,723	9,468	39,642
Grok 4.3	6.5	10.0	50.0%	0		55.07s	108,468	11,992	21,601

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0		20.38s	7,014	316	11,305
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	5.3	7.2	44.4%	1		202.38s	326	47,035	98,262
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0		17.83s	477	3,981	4,472
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0		12.53s	669	3,977	5,269
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	6.0	7.4	55.6%	1		25.06s	651	13,860	17,599
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0		8.92s	5,286	248	1,011
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	3.0	10.0	0.0%	0		130.27s	213	15,710	16,177
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Vergleichspaar wechseln