Kimi K2.7 Code (medium) vs Qwen3.7 Max

Model yang direkomendasikan Qwen3.7 Max

Its score stays close to the best score here (7.4 vs 7.5), while costing about 3.5x less than Kimi K2.7 Code (medium).

Perbandingan terperinci

Metrik	Kimi K2.7 Code Kimi K2.7 Code medium Rilis: 2026-06-12	Qwen3.7 Max Qwen3.7 Max none Rilis: 2026-05-22

Metrik	Kimi K2.7 Code Kimi K2.7 Code medium Rilis: 2026-06-12	Qwen3.7 Max Qwen3.7 Max none Rilis: 2026-05-22
Skor	7.5	7.4
Peringkat	#60	#67
Keandalan	10.0	9.9
Konsistensi	8.3	10.0
Tes benar
Tingkat lulus per percobaan	65.2%	68.2%
Tes tidak stabil	4	0
Total Run	66	66
Biaya per hasil	6.457	1.582
Total Biaya	$0.692	$0.197
Harga input	$0.780 / 1M	$1.475 / 1M
Harga output	$3.500 / 1M	$4.425 / 1M
Total token input	72,073	95,983
Token output	83,714	12,446
Token penalaran	178,793	0
Waktu respons (rata-rata)	84.25s	4.52s
Waktu respons (maks)	365.80s	72.30s
Waktu respons (total)	1769.22s	99.52s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	7.3	5.8	83.3%	2		11.56s	618	3,048	5,041
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	7.8	9.3	66.7%	0		146.73s	4,650	1,864	25,635
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	7.3	5.8	83.3%	1		66.03s	57,353	3,642	21,308
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	10.0	10.0	100.0%	0		12.27s	7,014	248	2,569
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	5.5	9.3	33.3%	0		213.29s	431	55,572	63,639
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	10.0	10.0	100.0%	0		10.78s	477	1,024	1,071
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	9.9	10.0	100.0%	0		5.39s	669	725	1,232
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	5.9	7.7	44.4%	1		41.00s	651	15,438	17,368
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Kimi K2.7 Code	3.0	10.0	0.0%	0		341.76s	210	2,153	40,930
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Ganti Pasangan Perbandingan