Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Gemini 3 Flash Preview 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah201 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

210/210

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	3/3	7.36s
Total Tes 3 Tes Salah 0 Total Biaya $3.112 Waktu respons (rata-rata) 7.36s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
Total Tes 3 Tes Salah 0 Total Biaya $0.267 Waktu respons (rata-rata) 16.4s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	3/3	6.34s
Total Tes 3 Tes Salah 0 Total Biaya $0.405 Waktu respons (rata-rata) 6.34s
#40	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	3/3	5.31s
Total Tes 3 Tes Salah 0 Total Biaya $2.057 Waktu respons (rata-rata) 5.31s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
Total Tes 3 Tes Salah 0 Total Biaya $2.077 Waktu respons (rata-rata) 3.01s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
Total Tes 3 Tes Salah 0 Total Biaya $0.307 Waktu respons (rata-rata) 11.3s
#54	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
Total Tes 3 Tes Salah 0 Total Biaya $0.571 Waktu respons (rata-rata) 2.99s
#55	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
Total Tes 3 Tes Salah 0 Total Biaya $0.519 Waktu respons (rata-rata) 4.46s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	3/3	32.5s
Total Tes 3 Tes Salah 0 Total Biaya $0.437 Waktu respons (rata-rata) 32.5s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	3/3	1.13s
Total Tes 3 Tes Salah 0 Total Biaya $0.197 Waktu respons (rata-rata) 1.13s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	3/3	5.77s
Total Tes 3 Tes Salah 0 Total Biaya $0.177 Waktu respons (rata-rata) 5.77s
#72	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
Total Tes 3 Tes Salah 0 Total Biaya $1.046 Waktu respons (rata-rata) 17.9s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	3/3	3.13s
Total Tes 3 Tes Salah 0 Total Biaya $1.079 Waktu respons (rata-rata) 3.13s
#82	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	3/3	3.61s
Total Tes 3 Tes Salah 0 Total Biaya $0.096 Waktu respons (rata-rata) 3.61s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	1.45s
Total Tes 3 Tes Salah 0 Total Biaya $0.300 Waktu respons (rata-rata) 1.45s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)