Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Step 3.5 Flash 0.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah204 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

216/216

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
Total Tes 3 Tes Salah 1 Total Biaya $0.661 Waktu respons (rata-rata) 2.53s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
Total Tes 3 Tes Salah 0 Total Biaya $0.231 Waktu respons (rata-rata) 2.65s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
Total Tes 3 Tes Salah 2 Total Biaya $0.047 Waktu respons (rata-rata) 2.65s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
Total Tes 3 Tes Salah 1 Total Biaya $0.073 Waktu respons (rata-rata) 2.71s
#117	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
Total Tes 3 Tes Salah 3 Total Biaya $0.044 Waktu respons (rata-rata) 2.74s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
Total Tes 3 Tes Salah 1 Total Biaya $1.166 Waktu respons (rata-rata) 2.74s
#122	Seed-2.0-Lite none	Bytedance Seed	5.3	6.2	$0.066	1/3	2.78s
Total Tes 3 Tes Salah 2 Total Biaya $0.066 Waktu respons (rata-rata) 2.78s
#129	Inkling low	Thinkingmachines	6.4	6.1	$0.187	1/3	2.97s
Total Tes 3 Tes Salah 2 Total Biaya $0.187 Waktu respons (rata-rata) 2.97s
#26	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	2.98s
Total Tes 3 Tes Salah 1 Total Biaya $0.922 Waktu respons (rata-rata) 2.98s
#7	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
Total Tes 3 Tes Salah 1 Total Biaya $1.316 Waktu respons (rata-rata) 2.98s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
Total Tes 3 Tes Salah 0 Total Biaya $0.571 Waktu respons (rata-rata) 2.99s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
Total Tes 3 Tes Salah 0 Total Biaya $2.077 Waktu respons (rata-rata) 3.01s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
Total Tes 3 Tes Salah 1 Total Biaya $0.476 Waktu respons (rata-rata) 3.03s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	3/3	3.04s
Total Tes 3 Tes Salah 0 Total Biaya $1.785 Waktu respons (rata-rata) 3.04s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.4	7.4	$0.387	1/3	3.11s
Total Tes 3 Tes Salah 2 Total Biaya $0.387 Waktu respons (rata-rata) 3.11s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)