Peringkat model Pemanggilan alat

Lihat model AI mana yang paling baik di Pemanggilan alat, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Pemanggilan alat

8.8

Model terbaik

Kimi K3 3.0

Alasan kegagalan

Dengan alasan kegagalan Kesalahan API17 Dengan alasan kegagalan Pemanggilan alat tidak valid9 Dengan alasan kegagalan Tidak mengikuti instruksi8 Dengan alasan kegagalan Jawaban salah3 Dengan alasan kegagalan Tidak ada jawaban2

216/216

Peringkat	Model	Perusahaan	Skor Pemanggilan alat	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	1/1	7.56s
Total Tes 1 Tes Salah 0 Total Biaya $0.971 Waktu respons (rata-rata) 7.56s
#57	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	1/1	7.71s
Total Tes 1 Tes Salah 0 Total Biaya $0.138 Waktu respons (rata-rata) 7.71s
#55	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	1/1	7.72s
Total Tes 1 Tes Salah 0 Total Biaya $0.774 Waktu respons (rata-rata) 7.72s
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	1/1	7.73s
Total Tes 1 Tes Salah 0 Total Biaya $2.310 Waktu respons (rata-rata) 7.73s
#115	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	1/1	8.19s
Total Tes 1 Tes Salah 0 Total Biaya $0.333 Waktu respons (rata-rata) 8.19s
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	1/1	8.21s
Total Tes 1 Tes Salah 0 Total Biaya $0.047 Waktu respons (rata-rata) 8.21s
#152	Owl Alpha medium	Openrouter	10.0	5.6	$0.000	1/1	8.26s
Total Tes 1 Tes Salah 0 Total Biaya $0.000 Waktu respons (rata-rata) 8.26s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	1/1	8.36s
Total Tes 1 Tes Salah 0 Total Biaya $0.571 Waktu respons (rata-rata) 8.36s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	1/1	8.55s
Total Tes 1 Tes Salah 0 Total Biaya $0.831 Waktu respons (rata-rata) 8.55s
#72	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	1/1	8.92s
Total Tes 1 Tes Salah 0 Total Biaya $1.036 Waktu respons (rata-rata) 8.92s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	8.96s
Total Tes 1 Tes Salah 0 Total Biaya $1.931 Waktu respons (rata-rata) 8.96s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	9.01s
Total Tes 1 Tes Salah 0 Total Biaya $0.089 Waktu respons (rata-rata) 9.01s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	1/1	9.25s
Total Tes 1 Tes Salah 0 Total Biaya $0.817 Waktu respons (rata-rata) 9.25s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	1/1	9.54s
Total Tes 1 Tes Salah 0 Total Biaya $0.646 Waktu respons (rata-rata) 9.54s
#60	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Total Tes 1 Tes Salah 1 Total Biaya $0.756 Waktu respons (rata-rata) 9.62s

←

1 9 10 11 15

→

Peringkat Pemanggilan alat

Filter model

Model teratas menurut Skor Pemanggilan alat

Skor Pemanggilan alat vs total biaya

Model teratas menurut Waktu respons (rata-rata)