Peringkat model Trik anti-AI

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Trik anti-AI, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

Rata-rata Skor Trik anti-AI

6.9

Model terbaik

Grok 4.20 Multi Agent Beta 6.9

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah250 Dengan alasan kegagalan Tidak mengikuti instruksi30 Dengan alasan kegagalan Format tambahan18 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4 Dengan alasan kegagalan Tidak ada jawaban3

169/169

Peringkat	Model	Perusahaan	Skor Trik anti-AI	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#29	Qwen3.5-27B medium	Qwen	8.7	7.9	$0.536	3/4	19.8s
Total Tes 4 Tes Salah 1 Total Biaya $0.536 Waktu respons (rata-rata) 19.8s
#27	GPT-5.4 Mini medium	OpenAI	8.6	8.0	$0.526	3/4	4.05s
Total Tes 4 Tes Salah 1 Total Biaya $0.526 Waktu respons (rata-rata) 4.05s
#3	Qwen3.7 Max medium	Qwen	10.0	9.4	$0.523	4/4	6.36s
Total Tes 4 Tes Salah 0 Total Biaya $0.523 Waktu respons (rata-rata) 6.36s
#49	Claude Opus 4.7 none	Anthropic	8.3	7.4	$0.505	3/4	2.12s
Total Tes 4 Tes Salah 1 Total Biaya $0.505 Waktu respons (rata-rata) 2.12s
#56	GLM 5V Turbo medium	Z.ai	7.2	7.3	$0.457	2/4	10.8s
Total Tes 4 Tes Salah 2 Total Biaya $0.457 Waktu respons (rata-rata) 10.8s
#81	Qwen3.6 27B medium	Qwen	8.3	6.6	$0.440	3/4	12.6s
Total Tes 4 Tes Salah 1 Total Biaya $0.440 Waktu respons (rata-rata) 12.6s
#45	GPT-5.3 Chat none	OpenAI	6.7	7.5	$0.433	2/4	3.86s
Total Tes 4 Tes Salah 2 Total Biaya $0.433 Waktu respons (rata-rata) 3.86s
#89	Qwen3.5-35B-A3B medium	Qwen	10.0	6.3	$0.401	4/4	21.1s
Total Tes 4 Tes Salah 0 Total Biaya $0.401 Waktu respons (rata-rata) 21.1s
#19	GPT-5.2 Chat none	OpenAI	8.7	8.5	$0.393	3/4	3.40s
Total Tes 4 Tes Salah 1 Total Biaya $0.393 Waktu respons (rata-rata) 3.40s
#91	Gemini 3 PRO Preview medium	Google	10.0	6.2	$0.385	4/4	15.0s
Total Tes 4 Tes Salah 0 Total Biaya $0.385 Waktu respons (rata-rata) 15.0s
#24	Gemini 2.5 Flash medium	Google	8.4	8.2	$0.379	3/4	6.30s
Total Tes 4 Tes Salah 1 Total Biaya $0.379 Waktu respons (rata-rata) 6.30s
#20	Step 3.7 Flash medium	Stepfun	8.7	8.5	$0.376	3/4	9.65s
Total Tes 4 Tes Salah 1 Total Biaya $0.376 Waktu respons (rata-rata) 9.65s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	4/4	2.52s
Total Tes 4 Tes Salah 0 Total Biaya $0.349 Waktu respons (rata-rata) 2.52s
#43	Kimi K2.5 medium	Moonshot AI	7.3	7.5	$0.348	2/4	51.4s
Total Tes 4 Tes Salah 2 Total Biaya $0.348 Waktu respons (rata-rata) 51.4s
#39	Step 3.7 Flash low	Stepfun	8.7	7.7	$0.341	3/4	4.02s
Total Tes 4 Tes Salah 1 Total Biaya $0.341 Waktu respons (rata-rata) 4.02s

Peringkat Trik anti-AI

Filter model

Model teratas menurut Skor Trik anti-AI

Skor Trik anti-AI vs total biaya

Model teratas menurut Waktu respons (rata-rata)