Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Step 3.5 Flash 0.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah204 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

216/216

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#170	Inkling none	Thinkingmachines	5.6	5.2	$0.147	1/3	931ms
Total Tes 3 Tes Salah 2 Total Biaya $0.147 Waktu respons (rata-rata) 931ms
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.237 Waktu respons (rata-rata) 15.2s
#33	Step 3.7 Flash medium	Stepfun	5.7	8.0	$0.515	1/3	6.19s
Total Tes 3 Tes Salah 2 Total Biaya $0.515 Waktu respons (rata-rata) 6.19s
#149	Gemini 3.1 Flash Lite high	Google	5.7	5.6	$2.044	1/3	50.8s
Total Tes 3 Tes Salah 2 Total Biaya $2.044 Waktu respons (rata-rata) 50.8s
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 3.71s
#56	Kimi K2.7 Code medium	Moonshot AI	5.9	7.5	$0.740	1/3	41.0s
Total Tes 3 Tes Salah 2 Total Biaya $0.740 Waktu respons (rata-rata) 41.0s
#77	Grok 4.3 medium	X AI	5.9	7.1	$0.779	1/3	22.5s
Total Tes 3 Tes Salah 2 Total Biaya $0.779 Waktu respons (rata-rata) 22.5s
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.103 Waktu respons (rata-rata) 20.7s
#135	Nemotron 3 Ultra none	NVIDIA	5.9	6.1	$0.095	1/3	1.06s
Total Tes 3 Tes Salah 2 Total Biaya $0.095 Waktu respons (rata-rata) 1.06s
#140	Mimo V2 Omni medium	Xiaomi	5.9	5.9	$0.683	1/3	2.38s
Total Tes 3 Tes Salah 2 Total Biaya $0.683 Waktu respons (rata-rata) 2.38s
#178	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.163 Waktu respons (rata-rata) 24.9s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	5.9	6.9	$0.467	1/3	3.20s
Total Tes 3 Tes Salah 2 Total Biaya $0.467 Waktu respons (rata-rata) 3.20s
#126	Gemini 3.1 Flash Lite minimal	Google	6.0	6.1	$0.047	1/3	2.15s
Total Tes 3 Tes Salah 2 Total Biaya $0.047 Waktu respons (rata-rata) 2.15s
#153	Mimo V2 PRO none	Xiaomi	6.0	5.6	$0.045	1/3	1.61s
Total Tes 3 Tes Salah 2 Total Biaya $0.045 Waktu respons (rata-rata) 1.61s
#35	GLM 5.2 high	Z.ai	6.0	8.0	$0.817	1/3	33.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.817 Waktu respons (rata-rata) 33.7s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)