Peringkat Trik anti-AI x Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

Inkling 1

Alasan kegagalan

Jawaban salah293 Tidak mengikuti instruksi33 Format tambahan20 Kesalahan API14 Kedaluwarsa4 Tidak ada jawaban4

Kategori

Pemrograman45 Gabungan26 Pemanggilan alat17 Parsing dan ekstraksi data14 Trik anti-AI14 Pengetahuan umum13 Kecerdasan umum12 Pemecahan teka-teki12 Spesifik domain7 Kepatuhan instruksi1

13/13

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#32	Inkling medium	Thinkingmachines	1	8.7	$0.391	3/4	6.49s
Total Tes 4 Tes Salah 1 Total Biaya $0.391 Waktu respons (rata-rata) 6.49s
#76	DeepSeek V3.2 medium	DeepSeek	1	8.2	$0.078	3/4	24.2s
Total Tes 4 Tes Salah 1 Total Biaya $0.078 Waktu respons (rata-rata) 24.2s
#153	Hy3 preview low	Tencent	1	8.3	$0.015	3/4	9.32s
Total Tes 4 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 9.32s
#175	Qwen3.6 Plus Preview medium	Qwen	1	8.3	$0.000	3/4	11.7s
Total Tes 4 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 11.7s
#135	Hy3 preview high	Tencent	2	6.4	$0.048	2/4	15.1s
Total Tes 4 Tes Salah 2 Total Biaya $0.048 Waktu respons (rata-rata) 15.1s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.9	$0.077	2/4	2.49s
Total Tes 4 Tes Salah 2 Total Biaya $0.077 Waktu respons (rata-rata) 2.49s
#186	Laguna M.1 medium	Poolside	1	6.5	$0.033	2/4	4.87s
Total Tes 4 Tes Salah 2 Total Biaya $0.033 Waktu respons (rata-rata) 4.87s
#198	Laguna Xs.2 medium	Poolside	1	6.9	$0.015	2/4	2.68s
Total Tes 4 Tes Salah 2 Total Biaya $0.015 Waktu respons (rata-rata) 2.68s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	6.4	$0.000	2/4	1.20s
Total Tes 4 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 1.20s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	4.8	$0.000	1/4	584ms
Total Tes 4 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 584ms
#173	DeepSeek V3.2 none	DeepSeek	1	3.2	$0.054	0/4	9.35s
Total Tes 4 Tes Salah 4 Total Biaya $0.054 Waktu respons (rata-rata) 9.35s
#192	Laguna M.1 none	Poolside	1	3.4	$0.009	0/4	705ms
Total Tes 4 Tes Salah 4 Total Biaya $0.009 Waktu respons (rata-rata) 705ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/4	534ms
Total Tes 4 Tes Salah 4 Total Biaya $0.004 Waktu respons (rata-rata) 534ms

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Trik anti-AI: Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang