Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Muse Spark 1.1 7.8

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah201 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

210/210

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#80	Seed-2.0-Mini medium	Bytedance Seed	8.2	7.0	$0.101	2/3	31.8s
Total Tes 3 Tes Salah 1 Total Biaya $0.101 Waktu respons (rata-rata) 31.8s
#74	GLM 5.1 medium	Z.ai	8.2	7.1	$0.535	2/3	31.6s
Total Tes 3 Tes Salah 1 Total Biaya $0.535 Waktu respons (rata-rata) 31.6s
#179	Ring-2.6-1T none	Inclusionai	7.7	4.8	$0.026	2/3	31.5s
Total Tes 3 Tes Salah 1 Total Biaya $0.026 Waktu respons (rata-rata) 31.5s
#135	Hy3 preview high	Tencent	7.7	5.9	$0.048	2/3	27.9s
Total Tes 3 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 27.9s
#114	Qwen3.5-Flash medium	Qwen	8.2	6.2	$0.139	2/3	27.6s
Total Tes 3 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 27.6s
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
Total Tes 3 Tes Salah 0 Total Biaya $0.163 Waktu respons (rata-rata) 26.9s
#45	DeepSeek V4 Flash high	DeepSeek	8.2	7.7	$0.042	2/3	26.1s
Total Tes 3 Tes Salah 1 Total Biaya $0.042 Waktu respons (rata-rata) 26.1s
#68	Kimi K2.6 medium	Moonshot AI	6.0	7.2	$1.036	1/3	25.1s
Total Tes 3 Tes Salah 2 Total Biaya $1.036 Waktu respons (rata-rata) 25.1s
#172	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.163 Waktu respons (rata-rata) 24.9s
#171	North Mini Code none	Cohere	3.5	5.1	$0.000	0/3	24.4s
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 24.4s
#166	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.025	0/3	24.3s
Total Tes 3 Tes Salah 3 Total Biaya $0.025 Waktu respons (rata-rata) 24.3s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	3/3	24.3s
Total Tes 3 Tes Salah 0 Total Biaya $1.143 Waktu respons (rata-rata) 24.3s
#150	DeepSeek V4 Flash none	DeepSeek	3.1	5.6	$0.044	0/3	23.7s
Total Tes 3 Tes Salah 3 Total Biaya $0.044 Waktu respons (rata-rata) 23.7s
#73	Grok 4.3 medium	X AI	5.9	7.1	$0.779	1/3	22.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.779 Waktu respons (rata-rata) 22.5s
#121	gpt-oss-120b medium	OpenAI	5.3	6.1	$0.019	1/3	21.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.019 Waktu respons (rata-rata) 21.7s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)