Verglichene Modelle

Empfohlenes Modell Claude Opus 4.7 (medium)

Es hat hier die beste Punktzahl (8.7) und antwortet etwa 10.6x schneller als die anderen Modelle in diesem Vergleich.

Detaillierter Vergleich

Metrik	Kimi K2.6 Kimi K2.6 medium Veröffentlichung: 2026-04-20	Kimi K2.5 Kimi K2.5 medium Veröffentlichung: 2026-01-27	GLM 5 GLM 5 medium Veröffentlichung: 2026-02-12	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16

Metrik	Kimi K2.6 Kimi K2.6 medium Veröffentlichung: 2026-04-20	Kimi K2.5 Kimi K2.5 medium Veröffentlichung: 2026-01-27	GLM 5 GLM 5 medium Veröffentlichung: 2026-02-12	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16
Punktzahl	7.2	7.0	7.7	8.7
Rang	#78	#87	#50	#20
Zuverlässigkeit	9.4	10.0	10.0	10.0
Konsistenz	8.3	7.0	8.1	9.6
Korrekte Tests
Erfolgsquote pro Versuch	63.6%	65.2%	78.8%	83.3%
Instabile Tests	4	8	4	1
Gesamtläufe	66	66	63	66
Kosten pro Ergebnis	9.821	4.789	1.668	8.201
Gesamtkosten	$0.831	$0.600	$0.307	$1.477
Eingabepreis	$0.646 / 1M	$0.571 / 1M	$0.950 / 1M	$5.000 / 1M
Ausgabepreis	$2.720 / 1M	$2.850 / 1M	$2.551 / 1M	$25.000 / 1M
Gesamte Eingabe-Token	68,902	118,448	35,224	145,252
Ausgabe-Token	111,680	62,124	21,570	24,948
Denk-Token	279,860	165,243	102,996	5,042
Antwortzeit (Durchschnitt)	109.98s	99.00s	33.54s	7.61s
Antwortzeit (Maximum)	876.20s	281.00s	99.85s	65.40s
Antwortzeit (Gesamt)	2309.56s	1485.04s	435.99s	159.91s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

medium

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	7.0	8.0	66.7%	1	11.59s	618	7,115	8,934
Kimi K2.5	7.3	5.8	83.3%	2	51.38s	634	2,789	8,880
GLM 5	10.0	10.0	100.0%	0	23.66s	555	480	7,056
Claude Opus 4.7	8.3	10.0	75.0%	0	1.85s	894	348	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	5.7	8.6	33.3%	0	214.42s	2,925	9,970	77,189
Kimi K2.5	6.1	4.6	66.7%	2	217.49s	6,935	5,705	74,693
GLM 5	10.0	10.0	100.0%	0	74.30s	7,254	2,997	52,930
Claude Opus 4.7	7.6	7.2	77.8%	1	12.96s	10,635	7,629	1,114

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	6.9	5.9	66.7%	1	458.58s	50,723	9,468	39,642
Kimi K2.5	6.7	9.1	50.0%	0	89.19s	95,416	14,448	11,209
GLM 5	5.0	5.0	50.0%	0	28.96s	12,804	662	3,242
Claude Opus 4.7	10.0	10.0	100.0%	0	43.42s	104,347	15,459	3,928

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0	20.38s	7,014	316	11,305
Kimi K2.5	10.0	10.0	100.0%	0	49.78s	7,020	563	7,940
GLM 5	7.1	5.6	83.3%	1	8.90s	5,508	567	3,734
Claude Opus 4.7	10.0	10.0	100.0%	0	2.37s	10,533	324	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	5.3	7.2	44.4%	1	202.38s	326	47,035	98,262
Kimi K2.5	3.5	4.4	33.3%	2	137.29s	485	20,753	30,564
GLM 5	3.5	4.4	33.3%	2	0ms	260	13,176	14,137
Claude Opus 4.7	7.7	10.0	66.7%	0	1.17s	630	51	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	0	17.83s	477	3,981	4,472
Kimi K2.5	6.5	3.4	66.7%	1	69.73s	480	3,815	4,262
GLM 5	6.1	3.1	66.7%	1	14.69s	477	2,020	2,248
Claude Opus 4.7	10.0	10.0	100.0%	0	2.87s	723	256	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	12.53s	669	3,977	5,269
Kimi K2.5	10.0	10.0	100.0%	92.47s	675	5,371	6,547
GLM 5	10.0	10.0	100.0%	7.25s	636	1,001	2,129
Claude Opus 4.7	10.0	10.0	100.0%	1.57s	939	114	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	6.0	7.4	55.6%	1	25.06s	651	13,860	17,599
Kimi K2.5	5.3	7.3	44.4%	1	43.23s	659	8,426	12,692
GLM 5	10.0	10.0	100.0%	0	11.33s	609	33	4,076
Claude Opus 4.7	10.0	10.0	100.0%	0	2.43s	939	370	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	10.0	10.0	100.0%	8.92s	5,286	248	1,011
Kimi K2.5	10.0	10.0	100.0%	31.74s	5,933	242	812
GLM 5	10.0	10.0	100.0%	15.93s	6,935	233	994
Claude Opus 4.7	10.0	10.0	100.0%	4.17s	15,339	373	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Kimi K2.6	3.0	10.0	0.0%	130.27s	213	15,710	16,177
Kimi K2.5	3.0	10.0	0.0%	83.95s	211	12	7,644
GLM 5	3.0	10.0	0.0%	67.37s	186	401	12,450
Claude Opus 4.7	3.0	10.0	0.0%	2.25s	273	24	0

Vergleichspaar wechseln