Peringkat model Trik anti-AI

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Trik anti-AI, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

Rata-rata Skor Trik anti-AI

6.9

Model terbaik

Grok 4.20 Multi Agent Beta 6.9

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah250 Dengan alasan kegagalan Tidak mengikuti instruksi30 Dengan alasan kegagalan Format tambahan18 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4 Dengan alasan kegagalan Tidak ada jawaban3

169/169

Peringkat	Model	Perusahaan	Skor Trik anti-AI	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	10.0	8.1	$0.158	4/4	8.62s
Total Tes 4 Tes Salah 0 Total Biaya $0.158 Waktu respons (rata-rata) 8.62s
#41	DeepSeek V4 Pro high	DeepSeek	5.7	7.6	$0.157	1/4	25.7s
Total Tes 4 Tes Salah 3 Total Biaya $0.157 Waktu respons (rata-rata) 25.7s
#75	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.146	4/4	6.02s
Total Tes 4 Tes Salah 0 Total Biaya $0.146 Waktu respons (rata-rata) 6.02s
#40	MiniMax M3 medium	Minimax	5.5	7.6	$0.131	1/4	14.9s
Total Tes 4 Tes Salah 3 Total Biaya $0.131 Waktu respons (rata-rata) 14.9s
#112	GPT-5.4 none	OpenAI	3.2	5.8	$0.122	0/4	1.21s
Total Tes 4 Tes Salah 4 Total Biaya $0.122 Waktu respons (rata-rata) 1.21s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	4/4	3.48s
Total Tes 4 Tes Salah 0 Total Biaya $0.111 Waktu respons (rata-rata) 3.48s
#71	Gemini 3.5 Flash minimal	Google	6.5	6.8	$0.108	2/4	892ms
Total Tes 4 Tes Salah 2 Total Biaya $0.108 Waktu respons (rata-rata) 892ms
#46	GPT-5.4 Nano medium	OpenAI	8.3	7.5	$0.107	3/4	4.52s
Total Tes 4 Tes Salah 1 Total Biaya $0.107 Waktu respons (rata-rata) 4.52s
#51	MiMo-V2.5-Pro medium	Xiaomi	10.0	7.4	$0.106	4/4	3.26s
Total Tes 4 Tes Salah 0 Total Biaya $0.106 Waktu respons (rata-rata) 3.26s
#127	MiniMax M2.7 medium	Minimax	7.9	5.2	$0.104	2/4	40.3s
Total Tes 4 Tes Salah 2 Total Biaya $0.104 Waktu respons (rata-rata) 40.3s
#149	Grok 4.20 Beta none	X AI	4.0	4.7	$0.087	0/4	597ms
Total Tes 4 Tes Salah 4 Total Biaya $0.087 Waktu respons (rata-rata) 597ms
#79	GPT-5 Nano medium	OpenAI	6.5	6.7	$0.081	2/4	25.5s
Total Tes 4 Tes Salah 2 Total Biaya $0.081 Waktu respons (rata-rata) 25.5s
#70	Qwen3.5-Flash medium	Qwen	10.0	6.8	$0.080	4/4	59.1s
Total Tes 4 Tes Salah 0 Total Biaya $0.080 Waktu respons (rata-rata) 59.1s
#111	Kimi K2.6 none	Moonshot AI	4.6	5.8	$0.079	1/4	1.39s
Total Tes 4 Tes Salah 3 Total Biaya $0.079 Waktu respons (rata-rata) 1.39s
#61	GLM 5.2 none	Z.ai	8.3	7.1	$0.076	3/4	3.70s
Total Tes 4 Tes Salah 1 Total Biaya $0.076 Waktu respons (rata-rata) 3.70s

Peringkat Trik anti-AI

Filter model

Model teratas menurut Skor Trik anti-AI

Skor Trik anti-AI vs total biaya

Model teratas menurut Waktu respons (rata-rata)