Peringkat Trik anti-AI x Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

Total kegagalan

293

Model yang paling terdampak

Seed-2.0-Lite 4

Alasan kegagalan

Jawaban salah293 Tidak mengikuti instruksi33 Format tambahan20 Kesalahan API14 Kedaluwarsa4 Tidak ada jawaban4

Kategori

Spesifik domain412 Trik anti-AI293 Pemrograman252 Pemecahan teka-teki201 Pengetahuan umum168 Gabungan68 Kepatuhan instruksi61 Kecerdasan umum59 Parsing dan ekstraksi data41 Pemanggilan alat3

140/140

Peringkat	Model	Perusahaan	Jumlah Jawaban salah	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#132	GPT-5.6 Terra none	OpenAI	3	4.8	$0.349	1/4	942ms
Total Tes 4 Tes Salah 3 Total Biaya $0.349 Waktu respons (rata-rata) 942ms
#138	Kimi K2.6 none	Moonshot AI	3	4.6	$0.184	1/4	1.39s
Total Tes 4 Tes Salah 3 Total Biaya $0.184 Waktu respons (rata-rata) 1.39s
#141	GLM 5 none	Z.ai	3	4.8	$0.041	1/4	2.37s
Total Tes 4 Tes Salah 3 Total Biaya $0.041 Waktu respons (rata-rata) 2.37s
#142	Qwen3.5-122B-A10B none	Qwen	3	4.8	$0.247	1/4	1.59s
Total Tes 4 Tes Salah 3 Total Biaya $0.247 Waktu respons (rata-rata) 1.59s
#145	GLM 5V Turbo none	Z.ai	3	4.8	$0.052	1/4	3.13s
Total Tes 4 Tes Salah 3 Total Biaya $0.052 Waktu respons (rata-rata) 3.13s
#146	Owl Alpha medium	Openrouter	3	4.8	$0.000	1/4	3.97s
Total Tes 4 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 3.97s
#148	Owl Alpha none	Openrouter	3	3.4	$0.000	0/4	2.78s
Total Tes 4 Tes Salah 4 Total Biaya $0.000 Waktu respons (rata-rata) 2.78s
#154	MiMo-V2.5-Pro none	Xiaomi	3	3.3	$0.068	0/4	2.67s
Total Tes 4 Tes Salah 4 Total Biaya $0.068 Waktu respons (rata-rata) 2.67s
#157	Mimo V2 Omni none	Xiaomi	3	3.6	$0.021	0/4	1.63s
Total Tes 4 Tes Salah 4 Total Biaya $0.021 Waktu respons (rata-rata) 1.63s
#159	GPT-5.6 Luna none	OpenAI	3	4.8	$0.142	1/4	901ms
Total Tes 4 Tes Salah 3 Total Biaya $0.142 Waktu respons (rata-rata) 901ms
#164	Inkling none	Thinkingmachines	3	4.8	$0.147	1/4	1.43s
Total Tes 4 Tes Salah 3 Total Biaya $0.147 Waktu respons (rata-rata) 1.43s
#167	Mistral Small 4 medium	Mistral	3	5.6	$0.096	1/4	2.67s
Total Tes 4 Tes Salah 3 Total Biaya $0.096 Waktu respons (rata-rata) 2.67s
#174	GPT-4o-mini none	OpenAI	3	4.8	$0.010	1/4	1.34s
Total Tes 4 Tes Salah 3 Total Biaya $0.010 Waktu respons (rata-rata) 1.34s
#176	GLM 4.7 Flash none	Z.ai	3	5.2	$0.016	1/4	5.51s
Total Tes 4 Tes Salah 3 Total Biaya $0.016 Waktu respons (rata-rata) 5.51s
#177	Nemotron 3 Super none	NVIDIA	3	4.8	$0.008	1/4	4.46s
Total Tes 4 Tes Salah 3 Total Biaya $0.008 Waktu respons (rata-rata) 4.46s

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Trik anti-AI: Jawaban salah

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang