Peringkat Kecerdasan umum x Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Kecerdasan umum, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

Hy3 preview 1

Alasan kegagalan

Tidak mengikuti instruksi78 Jawaban salah59 Kesalahan API12 Kedaluwarsa4

Kategori

Pemrograman45 Gabungan26 Pemanggilan alat17 Parsing dan ekstraksi data14 Trik anti-AI14 Pengetahuan umum13 Kecerdasan umum12 Pemecahan teka-teki12 Spesifik domain7 Kepatuhan instruksi1

12/12

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#135	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 0ms
#153	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.033 Waktu respons (rata-rata) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.009 Waktu respons (rata-rata) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#51	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
Total Tes 1 Tes Salah 1 Total Biaya $0.774 Waktu respons (rata-rata) 2.52s
#173	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
Total Tes 1 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 9.32s
#76	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.078 Waktu respons (rata-rata) 58.3s

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Kecerdasan umum: Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang