Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Step 3.5 Flash 0.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah201 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

210/210

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
Total Tes 3 Tes Salah 3 Total Biaya $0.041 Waktu respons (rata-rata) 1.57s
#91	LongCat 2.0 low	Meituan	3.1	6.7	$0.391	0/3	8.15s
Total Tes 3 Tes Salah 3 Total Biaya $0.391 Waktu respons (rata-rata) 8.15s
#125	Qwen3.5-Flash none	Qwen	3.1	6.1	$0.073	0/3	10.9s
Total Tes 3 Tes Salah 3 Total Biaya $0.073 Waktu respons (rata-rata) 10.9s
#162	Ling-2.6-1T none	Inclusionai	3.1	5.3	$0.016	0/3	5.36s
Total Tes 3 Tes Salah 3 Total Biaya $0.016 Waktu respons (rata-rata) 5.36s
#189	Mercury 2 none	Inception	3.1	4.6	$0.030	0/3	535ms
Total Tes 3 Tes Salah 3 Total Biaya $0.030 Waktu respons (rata-rata) 535ms
#199	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
Total Tes 3 Tes Salah 3 Total Biaya $0.003 Waktu respons (rata-rata) 4.56s
#138	Kimi K2.6 none	Moonshot AI	3.1	5.8	$0.184	0/3	1.40s
Total Tes 3 Tes Salah 3 Total Biaya $0.184 Waktu respons (rata-rata) 1.40s
#165	Mistral Small 4 none	Mistral	3.1	5.1	$0.022	0/3	399ms
Total Tes 3 Tes Salah 3 Total Biaya $0.022 Waktu respons (rata-rata) 399ms
#97	LongCat 2.0 high	Meituan	3.1	6.6	$0.469	0/3	9.18s
Total Tes 3 Tes Salah 3 Total Biaya $0.469 Waktu respons (rata-rata) 9.18s
#169	Qwen3.5-9B none	Qwen	3.2	5.1	$0.021	0/3	621ms
Total Tes 3 Tes Salah 3 Total Biaya $0.021 Waktu respons (rata-rata) 621ms
#201	Granite 4.1 8B none	IBM Granite	3.2	4.0	$0.007	0/3	608ms
Total Tes 3 Tes Salah 3 Total Biaya $0.007 Waktu respons (rata-rata) 608ms
#161	Qwen3.6 35B A3B none	Qwen	3.2	5.3	$0.061	0/3	1.07s
Total Tes 3 Tes Salah 3 Total Biaya $0.061 Waktu respons (rata-rata) 1.07s
#137	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 19.7s
#167	Mistral Small 4 medium	Mistral	3.4	5.1	$0.096	0/3	2.17s
Total Tes 3 Tes Salah 3 Total Biaya $0.096 Waktu respons (rata-rata) 2.17s
#124	Qwen3.6 Flash none	Qwen	3.5	6.1	$0.062	0/3	1.21s
Total Tes 3 Tes Salah 3 Total Biaya $0.062 Waktu respons (rata-rata) 1.21s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)