Peringkat Trik anti-AI x Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

Total kegagalan

293

Model yang paling terdampak

Seed-2.0-Lite 4

Alasan kegagalan

Jawaban salah293 Tidak mengikuti instruksi33 Format tambahan20 Kesalahan API14 Kedaluwarsa4 Tidak ada jawaban4

Kategori

Spesifik domain421 Trik anti-AI293 Pemrograman259 Pemecahan teka-teki204 Pengetahuan umum172 Gabungan69 Kecerdasan umum62 Kepatuhan instruksi61 Parsing dan ekstraksi data41 Pemanggilan alat3

140/140

Peringkat	Model	Perusahaan	Jumlah Jawaban salah	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#188	KAT-Coder-Air V2.5 none	Kwaipilot	3	5.3	$0.067	1/4	2.68s
Total Tes 4 Tes Salah 3 Total Biaya $0.067 Waktu respons (rata-rata) 2.68s
#193	Qwen3 Coder Next medium	Qwen	3	3.5	$0.032	0/4	8.64s
Total Tes 4 Tes Salah 4 Total Biaya $0.032 Waktu respons (rata-rata) 8.64s
#198	Laguna M.1 none	Poolside	3	3.4	$0.009	0/4	705ms
Total Tes 4 Tes Salah 4 Total Biaya $0.009 Waktu respons (rata-rata) 705ms
#203	Grok 4.20 none	X AI	3	4.8	$0.057	1/4	501ms
Total Tes 4 Tes Salah 3 Total Biaya $0.057 Waktu respons (rata-rata) 501ms
#209	Grok 4.1 Fast none	X AI	3	3.2	$0.008	0/4	1.07s
Total Tes 4 Tes Salah 4 Total Biaya $0.008 Waktu respons (rata-rata) 1.07s
#216	LFM2-24B-A2B none	Liquid	3	2.5	$0.001	0/3	471ms
Total Tes 3 Tes Salah 3 Total Biaya $0.001 Waktu respons (rata-rata) 471ms
#27	Muse Spark 1.1 low	Meta	2	7.9	$0.647	2/4	4.36s
Total Tes 4 Tes Salah 2 Total Biaya $0.647 Waktu respons (rata-rata) 4.36s
#50	DeepSeek V4 Pro high	DeepSeek	2	5.7	$0.200	1/4	25.7s
Total Tes 4 Tes Salah 3 Total Biaya $0.200 Waktu respons (rata-rata) 25.7s
#51	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/4	14.9s
Total Tes 4 Tes Salah 3 Total Biaya $0.286 Waktu respons (rata-rata) 14.9s
#56	Kimi K2.7 Code medium	Moonshot AI	2	7.3	$0.740	2/4	11.6s
Total Tes 4 Tes Salah 2 Total Biaya $0.740 Waktu respons (rata-rata) 11.6s
#63	Qwen3.7 Max none	Qwen	2	6.5	$0.197	2/4	1.08s
Total Tes 4 Tes Salah 2 Total Biaya $0.197 Waktu respons (rata-rata) 1.08s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	2	6.9	$0.387	2/4	4.20s
Total Tes 4 Tes Salah 2 Total Biaya $0.387 Waktu respons (rata-rata) 4.20s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	2	7.0	$0.482	2/4	3.17s
Total Tes 4 Tes Salah 2 Total Biaya $0.482 Waktu respons (rata-rata) 3.17s
#75	Qwen3.7 Plus none	Qwen	2	6.5	$0.106	2/4	1.38s
Total Tes 4 Tes Salah 2 Total Biaya $0.106 Waktu respons (rata-rata) 1.38s
#86	DeepSeek V4 Pro none	DeepSeek	2	3.2	$0.096	0/4	4.02s
Total Tes 4 Tes Salah 4 Total Biaya $0.096 Waktu respons (rata-rata) 4.02s

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Trik anti-AI: Jawaban salah

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang