Peringkat kegagalan Kesalahan API

Lihat model AI mana yang paling sering mengalami Kesalahan API, agar Anda bisa melihat risiko keandalan sebelum memilih.

Model yang ditampilkan

Total kegagalan

161

Model yang paling terdampak

Qwen3.6 Plus Preview 8

Kategori

Dalam kategori Pemrograman45 Dalam kategori Gabungan26 Dalam kategori Pemanggilan alat17 Dalam kategori Parsing dan ekstraksi data14 Dalam kategori Trik anti-AI14 Dalam kategori Pengetahuan umum13 Dalam kategori Kecerdasan umum12 Dalam kategori Pemecahan teka-teki12 Dalam kategori Spesifik domain7 Dalam kategori Kepatuhan instruksi1

68/68

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
Total Tes 22 Tes Salah 15 Total Biaya $0.041 Waktu respons (rata-rata) 10.1s
#161	Qwen3.6 35B A3B none	Qwen	2	5.3	$0.061	4/22	5.52s
Total Tes 22 Tes Salah 18 Total Biaya $0.061 Waktu respons (rata-rata) 5.52s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
Total Tes 22 Tes Salah 17 Total Biaya $0.096 Waktu respons (rata-rata) 10.8s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
Total Tes 22 Tes Salah 16 Total Biaya $0.002 Waktu respons (rata-rata) 10.7s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
Total Tes 18 Tes Salah 10 Total Biaya $5.599 Waktu respons (rata-rata) 9.69s
#183	Trinity Large Preview none	Arcee AI	2	4.8	$0.008	4/21	2.98s
Total Tes 21 Tes Salah 17 Total Biaya $0.008 Waktu respons (rata-rata) 2.98s
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
Total Tes 22 Tes Salah 10 Total Biaya $1.694 Waktu respons (rata-rata) 31.5s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
Total Tes 22 Tes Salah 7 Total Biaya $0.391 Waktu respons (rata-rata) 16.2s
#37	Qwen3.6 Plus medium	Qwen	1	7.8	$0.405	15/22	43.1s
Total Tes 22 Tes Salah 7 Total Biaya $0.405 Waktu respons (rata-rata) 43.1s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Total Tes 22 Tes Salah 12 Total Biaya $0.200 Waktu respons (rata-rata) 79.1s
#51	Nemotron 3 Ultra medium	NVIDIA	1	7.5	$0.774	13/22	32.2s
Total Tes 22 Tes Salah 9 Total Biaya $0.774 Waktu respons (rata-rata) 32.2s
#52	Kimi K2.7 Code medium	Moonshot AI	1	7.5	$0.751	12/22	84.2s
Total Tes 22 Tes Salah 10 Total Biaya $0.751 Waktu respons (rata-rata) 84.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	7.5	$0.437	14/22	89.2s
Total Tes 22 Tes Salah 8 Total Biaya $0.437 Waktu respons (rata-rata) 89.2s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Total Tes 22 Tes Salah 10 Total Biaya $0.478 Waktu respons (rata-rata) 136.6s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	7.4	$0.387	11/22	19.5s
Total Tes 22 Tes Salah 11 Total Biaya $0.387 Waktu respons (rata-rata) 19.5s

←

1 2 3 4 5

→

Kegagalan Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)