Peringkat kegagalan Kesalahan API

Lihat model AI mana yang paling sering mengalami Kesalahan API, agar Anda bisa melihat risiko keandalan sebelum memilih.

Model yang ditampilkan

Total kegagalan

161

Model yang paling terdampak

Qwen3.6 Plus Preview 8

Kategori

Dalam kategori Pemrograman45 Dalam kategori Gabungan26 Dalam kategori Pemanggilan alat17 Dalam kategori Parsing dan ekstraksi data14 Dalam kategori Trik anti-AI14 Dalam kategori Pengetahuan umum13 Dalam kategori Kecerdasan umum12 Dalam kategori Pemecahan teka-teki12 Dalam kategori Spesifik domain7 Dalam kategori Kepatuhan instruksi1

68/68

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
Total Tes 22 Tes Salah 9 Total Biaya $0.535 Waktu respons (rata-rata) 46.8s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
Total Tes 22 Tes Salah 11 Total Biaya $0.467 Waktu respons (rata-rata) 24.0s
#84	MiMo-V2.5-Pro medium	Xiaomi	1	6.9	$0.187	12/22	33.9s
Total Tes 22 Tes Salah 10 Total Biaya $0.187 Waktu respons (rata-rata) 33.9s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Total Tes 22 Tes Salah 12 Total Biaya $0.391 Waktu respons (rata-rata) 100.3s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Total Tes 21 Tes Salah 9 Total Biaya $0.333 Waktu respons (rata-rata) 22.2s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.3	$0.043	12/21	20.1s
Total Tes 21 Tes Salah 9 Total Biaya $0.043 Waktu respons (rata-rata) 20.1s
#114	Qwen3.5-Flash medium	Qwen	1	6.2	$0.139	12/22	84.8s
Total Tes 22 Tes Salah 10 Total Biaya $0.139 Waktu respons (rata-rata) 84.8s
#119	Qwen3.5-35B-A3B medium	Qwen	1	6.2	$0.837	11/22	112.5s
Total Tes 22 Tes Salah 11 Total Biaya $0.837 Waktu respons (rata-rata) 112.5s
#129	Nemotron 3 Ultra none	NVIDIA	1	6.1	$0.095	8/22	3.87s
Total Tes 22 Tes Salah 14 Total Biaya $0.095 Waktu respons (rata-rata) 3.87s
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Total Tes 21 Tes Salah 10 Total Biaya $0.108 Waktu respons (rata-rata) 174.2s
#134	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
Total Tes 21 Tes Salah 11 Total Biaya $0.683 Waktu respons (rata-rata) 41.2s
#137	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
Total Tes 22 Tes Salah 13 Total Biaya $0.000 Waktu respons (rata-rata) 137.1s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
Total Tes 21 Tes Salah 13 Total Biaya $0.000 Waktu respons (rata-rata) 11.9s
#147	Mimo V2 PRO none	Xiaomi	1	5.6	$0.045	7/21	2.27s
Total Tes 21 Tes Salah 14 Total Biaya $0.045 Waktu respons (rata-rata) 2.27s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
Total Tes 22 Tes Salah 14 Total Biaya $0.048 Waktu respons (rata-rata) 8.42s

←

1 2 3 4 5

→

Kegagalan Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)