Peringkat model Trik anti-AI

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Trik anti-AI, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↑.

Model yang ditampilkan

Rata-rata Skor Trik anti-AI

6.9

Model terbaik

North Mini Code 8.4

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah250 Dengan alasan kegagalan Tidak mengikuti instruksi30 Dengan alasan kegagalan Format tambahan18 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4 Dengan alasan kegagalan Tidak ada jawaban3

169/169

Peringkat	Model	Perusahaan	Skor Trik anti-AI	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#10	GPT-5.3-Codex medium	OpenAI	8.7	8.9	$0.740	3/4	4.16s
Total Tes 4 Tes Salah 1 Total Biaya $0.740 Waktu respons (rata-rata) 4.16s
#69	Grok 4.20 Beta medium	X AI	8.7	6.8	$0.750	3/4	3.16s
Total Tes 4 Tes Salah 1 Total Biaya $0.750 Waktu respons (rata-rata) 3.16s
#35	Kimi K2.6 medium	Moonshot AI	7.0	7.8	$0.889	2/4	11.6s
Total Tes 4 Tes Salah 2 Total Biaya $0.889 Waktu respons (rata-rata) 11.6s
#4	GPT-5.5 low	OpenAI	10.0	9.3	$0.907	4/4	4.41s
Total Tes 4 Tes Salah 0 Total Biaya $0.907 Waktu respons (rata-rata) 4.41s
#42	Grok Build 0.1 medium	X AI	8.3	7.6	$0.927	3/4	7.43s
Total Tes 4 Tes Salah 1 Total Biaya $0.927 Waktu respons (rata-rata) 7.43s
#11	Qwen3.6 Max Preview medium	Qwen	10.0	8.9	$0.960	4/4	22.1s
Total Tes 4 Tes Salah 0 Total Biaya $0.960 Waktu respons (rata-rata) 22.1s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	4/4	7.90s
Total Tes 4 Tes Salah 0 Total Biaya $1.054 Waktu respons (rata-rata) 7.90s
#66	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	4/4	2.53s
Total Tes 4 Tes Salah 0 Total Biaya $1.079 Waktu respons (rata-rata) 2.53s
#12	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.107	4/4	3.95s
Total Tes 4 Tes Salah 0 Total Biaya $1.107 Waktu respons (rata-rata) 3.95s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	4/4	2.57s
Total Tes 4 Tes Salah 0 Total Biaya $1.115 Waktu respons (rata-rata) 2.57s
#63	Step 3.7 Flash high	Stepfun	10.0	7.1	$1.148	4/4	13.4s
Total Tes 4 Tes Salah 0 Total Biaya $1.148 Waktu respons (rata-rata) 13.4s
#17	GPT-5.4 medium	OpenAI	8.3	8.5	$1.210	3/4	4.11s
Total Tes 4 Tes Salah 1 Total Biaya $1.210 Waktu respons (rata-rata) 4.11s
#31	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$1.418	2/4	2.98s
Total Tes 4 Tes Salah 2 Total Biaya $1.418 Waktu respons (rata-rata) 2.98s
#83	Gemini 3.1 Flash Lite high	Google	8.7	6.5	$2.044	3/4	37.2s
Total Tes 4 Tes Salah 1 Total Biaya $2.044 Waktu respons (rata-rata) 37.2s
#38	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$2.053	2/4	7.45s
Total Tes 4 Tes Salah 2 Total Biaya $2.053 Waktu respons (rata-rata) 7.45s

Peringkat Trik anti-AI

Filter model

Model teratas menurut Skor Trik anti-AI

Skor Trik anti-AI vs total biaya

Model teratas menurut Waktu respons (rata-rata)