Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Gemini 3.6 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah204 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

216/216

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#105	Qwen3.6 27B medium	Qwen	7.7	6.5	$0.779	2/3	61.1s
Total Tes 3 Tes Salah 1 Total Biaya $0.779 Waktu respons (rata-rata) 61.1s
#106	Hy3 preview medium	Tencent	7.7	6.5	$0.018	2/3	11.1s
Total Tes 3 Tes Salah 1 Total Biaya $0.018 Waktu respons (rata-rata) 11.1s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
Total Tes 3 Tes Salah 1 Total Biaya $0.082 Waktu respons (rata-rata) 20.3s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
Total Tes 3 Tes Salah 1 Total Biaya $0.073 Waktu respons (rata-rata) 2.71s
#119	MiMo-V2-Flash medium	Xiaomi	7.7	6.3	$0.043	2/3	3.87s
Total Tes 3 Tes Salah 1 Total Biaya $0.043 Waktu respons (rata-rata) 3.87s
#120	Qwen3.5-Flash medium	Qwen	8.2	6.2	$0.139	2/3	27.6s
Total Tes 3 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 27.6s
#123	GPT-5.6 Luna low	OpenAI	7.6	6.2	$0.249	2/3	3.59s
Total Tes 3 Tes Salah 1 Total Biaya $0.249 Waktu respons (rata-rata) 3.59s
#124	Gemini 2.5 Flash none	Google	7.7	6.2	$0.017	2/3	604ms
Total Tes 3 Tes Salah 1 Total Biaya $0.017 Waktu respons (rata-rata) 604ms
#125	Qwen3.5-35B-A3B medium	Qwen	8.2	6.2	$0.837	2/3	33.1s
Total Tes 3 Tes Salah 1 Total Biaya $0.837 Waktu respons (rata-rata) 33.1s
#141	Hy3 preview high	Tencent	7.7	5.9	$0.048	2/3	27.9s
Total Tes 3 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 27.9s
#147	GLM 5 none	Z.ai	7.7	5.7	$0.041	2/3	1.91s
Total Tes 3 Tes Salah 1 Total Biaya $0.041 Waktu respons (rata-rata) 1.91s
#157	GLM 5.1 none	Z.ai	7.7	5.5	$0.164	2/3	1.45s
Total Tes 3 Tes Salah 1 Total Biaya $0.164 Waktu respons (rata-rata) 1.45s
#169	Gemini 3.1 Flash Lite Preview high	Google	7.7	5.3	$2.310	2/3	46.7s
Total Tes 3 Tes Salah 1 Total Biaya $2.310 Waktu respons (rata-rata) 46.7s
#179	DeepSeek V3.2 none	DeepSeek	7.6	5.0	$0.054	2/3	6.91s
Total Tes 3 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 6.91s
#185	Ring-2.6-1T none	Inclusionai	7.7	4.8	$0.026	2/3	31.5s
Total Tes 3 Tes Salah 1 Total Biaya $0.026 Waktu respons (rata-rata) 31.5s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)