Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Gemini 3 Flash Preview 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah201 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

210/210

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
Total Tes 3 Tes Salah 0 Total Biaya $0.505 Waktu respons (rata-rata) 2.46s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	3/3	5.79s
Total Tes 3 Tes Salah 0 Total Biaya $0.089 Waktu respons (rata-rata) 5.79s
#98	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
Total Tes 3 Tes Salah 0 Total Biaya $0.231 Waktu respons (rata-rata) 2.65s
#104	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
Total Tes 3 Tes Salah 0 Total Biaya $0.646 Waktu respons (rata-rata) 1.69s
#105	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	3/3	1.40s
Total Tes 3 Tes Salah 0 Total Biaya $0.621 Waktu respons (rata-rata) 1.40s
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	3/3	900ms
Total Tes 3 Tes Salah 0 Total Biaya $0.052 Waktu respons (rata-rata) 900ms
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
Total Tes 3 Tes Salah 0 Total Biaya $0.163 Waktu respons (rata-rata) 26.9s
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	3/3	3.52s
Total Tes 3 Tes Salah 0 Total Biaya $0.750 Waktu respons (rata-rata) 3.52s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
Total Tes 3 Tes Salah 0 Total Biaya $0.385 Waktu respons (rata-rata) 3.88s
#157	Mimo V2 Omni none	Xiaomi	10.0	5.5	$0.021	3/3	1.16s
Total Tes 3 Tes Salah 0 Total Biaya $0.021 Waktu respons (rata-rata) 1.16s
#3	GPT-5.6 Sol low	OpenAI	8.2	9.5	$0.971	2/3	3.44s
Total Tes 3 Tes Salah 1 Total Biaya $0.971 Waktu respons (rata-rata) 3.44s
#4	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
Total Tes 3 Tes Salah 1 Total Biaya $1.316 Waktu respons (rata-rata) 2.98s
#9	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	2.38s
Total Tes 3 Tes Salah 1 Total Biaya $0.642 Waktu respons (rata-rata) 2.38s
#13	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
Total Tes 3 Tes Salah 1 Total Biaya $0.920 Waktu respons (rata-rata) 5.05s
#16	Muse Spark 1.1 medium	Meta	7.9	8.6	$1.357	2/3	42.5s
Total Tes 3 Tes Salah 1 Total Biaya $1.357 Waktu respons (rata-rata) 42.5s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)