Peringkat model Pemecahan teka-teki

Lihat model AI mana yang paling baik di Pemecahan teka-teki, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Pemecahan teka-teki

6.7

Model terbaik

Gemini 3.6 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah204 Dengan alasan kegagalan Tidak mengikuti instruksi90 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Format tambahan8 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Tidak ada jawaban3

216/216

Peringkat	Model	Perusahaan	Skor Pemecahan teka-teki	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#28	Gemini 2.5 Flash medium	Google	7.7	8.2	$0.643	2/3	3.18s
Total Tes 3 Tes Salah 1 Total Biaya $0.643 Waktu respons (rata-rata) 3.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
Total Tes 3 Tes Salah 1 Total Biaya $0.604 Waktu respons (rata-rata) 4.10s
#38	GPT-5.6 Terra high	OpenAI	7.7	8.0	$1.055	2/3	5.45s
Total Tes 3 Tes Salah 1 Total Biaya $1.055 Waktu respons (rata-rata) 5.45s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
Total Tes 3 Tes Salah 1 Total Biaya $3.059 Waktu respons (rata-rata) 4.71s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
Total Tes 3 Tes Salah 1 Total Biaya $1.097 Waktu respons (rata-rata) 18.3s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
Total Tes 3 Tes Salah 1 Total Biaya $0.661 Waktu respons (rata-rata) 2.53s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.7	7.3	$0.115	2/3	5.30s
Total Tes 3 Tes Salah 1 Total Biaya $0.115 Waktu respons (rata-rata) 5.30s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
Total Tes 3 Tes Salah 1 Total Biaya $1.166 Waktu respons (rata-rata) 2.74s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
Total Tes 3 Tes Salah 1 Total Biaya $0.106 Waktu respons (rata-rata) 1.71s
#79	Grok 4.20 medium	X AI	7.7	7.1	$0.777	2/3	6.22s
Total Tes 3 Tes Salah 1 Total Biaya $0.777 Waktu respons (rata-rata) 6.22s
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
Total Tes 3 Tes Salah 1 Total Biaya $0.524 Waktu respons (rata-rata) 1.49s
#91	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
Total Tes 3 Tes Salah 1 Total Biaya $0.544 Waktu respons (rata-rata) 1.29s
#93	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
Total Tes 3 Tes Salah 1 Total Biaya $0.085 Waktu respons (rata-rata) 1.05s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
Total Tes 3 Tes Salah 1 Total Biaya $0.457 Waktu respons (rata-rata) 10.2s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
Total Tes 3 Tes Salah 1 Total Biaya $0.128 Waktu respons (rata-rata) 3.31s

Peringkat Pemecahan teka-teki

Filter model

Model teratas menurut Skor Pemecahan teka-teki

Skor Pemecahan teka-teki vs total biaya

Model teratas menurut Waktu respons (rata-rata)