Peringkat model Trik anti-AI

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Trik anti-AI, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

Rata-rata Skor Trik anti-AI

6.9

Model terbaik

Grok 4.20 Multi Agent Beta 6.9

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah250 Dengan alasan kegagalan Tidak mengikuti instruksi30 Dengan alasan kegagalan Format tambahan18 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4 Dengan alasan kegagalan Tidak ada jawaban3

169/169

Peringkat	Model	Perusahaan	Skor Trik anti-AI	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#136	Grok 4.20 Multi Agent Beta medium	X AI	6.9	5.0	$5.599	2/4	3.46s
Total Tes 4 Tes Salah 2 Total Biaya $5.599 Waktu respons (rata-rata) 3.46s
#9	GPT-5.5 medium	OpenAI	10.0	9.0	$3.679	4/4	4.66s
Total Tes 4 Tes Salah 0 Total Biaya $3.679 Waktu respons (rata-rata) 4.66s
#6	Claude Fable 5 medium	Anthropic	10.0	9.2	$3.165	4/4	6.20s
Total Tes 4 Tes Salah 0 Total Biaya $3.165 Waktu respons (rata-rata) 6.20s
#95	Gemini 3.1 Flash Lite Preview high	Google	7.5	6.1	$2.310	3/3	43.9s
Total Tes 3 Tes Salah 0 Total Biaya $2.310 Waktu respons (rata-rata) 43.9s
#38	Claude Opus 4.6 medium	Anthropic	6.4	7.7	$2.053	2/4	7.45s
Total Tes 4 Tes Salah 2 Total Biaya $2.053 Waktu respons (rata-rata) 7.45s
#83	Gemini 3.1 Flash Lite high	Google	8.7	6.5	$2.044	3/4	37.2s
Total Tes 4 Tes Salah 1 Total Biaya $2.044 Waktu respons (rata-rata) 37.2s
#31	Claude Sonnet 4.6 medium	Anthropic	6.5	7.8	$1.418	2/4	2.98s
Total Tes 4 Tes Salah 2 Total Biaya $1.418 Waktu respons (rata-rata) 2.98s
#17	GPT-5.4 medium	OpenAI	8.3	8.5	$1.210	3/4	4.11s
Total Tes 4 Tes Salah 1 Total Biaya $1.210 Waktu respons (rata-rata) 4.11s
#63	Step 3.7 Flash high	Stepfun	10.0	7.1	$1.148	4/4	13.4s
Total Tes 4 Tes Salah 0 Total Biaya $1.148 Waktu respons (rata-rata) 13.4s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	4/4	2.57s
Total Tes 4 Tes Salah 0 Total Biaya $1.115 Waktu respons (rata-rata) 2.57s
#12	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.107	4/4	3.95s
Total Tes 4 Tes Salah 0 Total Biaya $1.107 Waktu respons (rata-rata) 3.95s
#66	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	4/4	2.53s
Total Tes 4 Tes Salah 0 Total Biaya $1.079 Waktu respons (rata-rata) 2.53s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	4/4	7.90s
Total Tes 4 Tes Salah 0 Total Biaya $1.054 Waktu respons (rata-rata) 7.90s
#11	Qwen3.6 Max Preview medium	Qwen	10.0	8.9	$0.960	4/4	22.1s
Total Tes 4 Tes Salah 0 Total Biaya $0.960 Waktu respons (rata-rata) 22.1s
#42	Grok Build 0.1 medium	X AI	8.3	7.6	$0.927	3/4	7.43s
Total Tes 4 Tes Salah 1 Total Biaya $0.927 Waktu respons (rata-rata) 7.43s

Peringkat Trik anti-AI

Filter model

Model teratas menurut Skor Trik anti-AI

Skor Trik anti-AI vs total biaya

Model teratas menurut Waktu respons (rata-rata)