Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

GPT-5.4 Nano 4.1

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah204 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

216/216

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#174	MiMo-V2.5 none	Xiaomi	5.4	5.1	$0.025	1/3	2.13s
Total Tes 3 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 2.13s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
Total Tes 3 Tes Salah 2 Total Biaya $0.047 Waktu respons (rata-rata) 2.65s
#178	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
Total Tes 3 Tes Salah 2 Total Biaya $0.163 Waktu respons (rata-rata) 24.9s
#181	Qwen3.6 Plus Preview medium	Qwen	5.3	4.9	$0.000	1/3	7.52s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 7.52s
#182	GLM 4.7 Flash none	Z.ai	6.4	4.9	$0.016	1/3	1.20s
Total Tes 3 Tes Salah 2 Total Biaya $0.016 Waktu respons (rata-rata) 1.20s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
Total Tes 3 Tes Salah 2 Total Biaya $0.008 Waktu respons (rata-rata) 2.36s
#186	GPT-5.4 Nano none	OpenAI	5.4	4.8	$0.041	1/3	1.25s
Total Tes 3 Tes Salah 2 Total Biaya $0.041 Waktu respons (rata-rata) 1.25s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.7	4.8	$5.599	1/3	5.19s
Total Tes 3 Tes Salah 2 Total Biaya $5.599 Waktu respons (rata-rata) 5.19s
#190	Hunter Alpha medium	OpenRouter	6.1	4.7	$0.000	1/3	5.35s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 5.35s
#191	Grok 4.1 Fast medium	X AI	5.3	4.7	$0.069	1/3	7.40s
Total Tes 3 Tes Salah 2 Total Biaya $0.069 Waktu respons (rata-rata) 7.40s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	10.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.033 Waktu respons (rata-rata) 10.2s
#196	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.340 Waktu respons (rata-rata) 11.2s
#201	Elephant Alpha medium	Openrouter	5.3	4.3	$0.000	1/3	868ms
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 868ms
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 3.71s
#203	Grok 4.20 none	X AI	5.3	4.1	$0.057	1/3	473ms
Total Tes 3 Tes Salah 2 Total Biaya $0.057 Waktu respons (rata-rata) 473ms

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)