Peringkat model Pemanggilan alat

Lihat model AI mana yang paling baik di Pemanggilan alat, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Pemanggilan alat

8.7

Model terbaik

Kimi K3 3.0

Alasan kegagalan

Dengan alasan kegagalan Kesalahan API17 Dengan alasan kegagalan Pemanggilan alat tidak valid9 Dengan alasan kegagalan Tidak mengikuti instruksi8 Dengan alasan kegagalan Jawaban salah3 Dengan alasan kegagalan Tidak ada jawaban2

210/210

Peringkat	Model	Perusahaan	Skor Pemanggilan alat	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#124	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	2.49s
Total Tes 1 Tes Salah 0 Total Biaya $0.062 Waktu respons (rata-rata) 2.49s
#164	Inkling none	Thinkingmachines	3.0	5.2	$0.147	0/1	2.50s
Total Tes 1 Tes Salah 1 Total Biaya $0.147 Waktu respons (rata-rata) 2.50s
#174	GPT-4o-mini none	OpenAI	10.0	5.0	$0.010	1/1	2.51s
Total Tes 1 Tes Salah 0 Total Biaya $0.010 Waktu respons (rata-rata) 2.51s
#123	Inkling low	Thinkingmachines	3.0	6.1	$0.187	0/1	2.57s
Total Tes 1 Tes Salah 1 Total Biaya $0.187 Waktu respons (rata-rata) 2.57s
#187	Qwen3 Coder Next medium	Qwen	10.0	4.7	$0.032	1/1	2.64s
Total Tes 1 Tes Salah 0 Total Biaya $0.032 Waktu respons (rata-rata) 2.64s
#139	GPT-5.4 none	OpenAI	10.0	5.8	$0.397	1/1	2.75s
Total Tes 1 Tes Salah 0 Total Biaya $0.397 Waktu respons (rata-rata) 2.75s
#193	Elephant Alpha none	Openrouter	3.0	4.3	$0.000	0/1	2.79s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 2.79s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	1/1	2.79s
Total Tes 1 Tes Salah 0 Total Biaya $0.300 Waktu respons (rata-rata) 2.79s
#86	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	1/1	2.79s
Total Tes 1 Tes Salah 0 Total Biaya $1.207 Waktu respons (rata-rata) 2.79s
#159	GPT-5.6 Luna none	OpenAI	10.0	5.4	$0.142	1/1	2.80s
Total Tes 1 Tes Salah 0 Total Biaya $0.142 Waktu respons (rata-rata) 2.80s
#195	Elephant Alpha medium	Openrouter	3.0	4.3	$0.000	0/1	2.83s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 2.83s
#122	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	1/1	2.97s
Total Tes 1 Tes Salah 0 Total Biaya $0.046 Waktu respons (rata-rata) 2.97s
#129	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	1/1	2.99s
Total Tes 1 Tes Salah 0 Total Biaya $0.095 Waktu respons (rata-rata) 2.99s
#102	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	1/1	3.01s
Total Tes 1 Tes Salah 0 Total Biaya $0.068 Waktu respons (rata-rata) 3.01s
#132	GPT-5.6 Terra none	OpenAI	9.6	6.0	$0.349	1/1	3.10s
Total Tes 1 Tes Salah 0 Total Biaya $0.349 Waktu respons (rata-rata) 3.10s

Peringkat Pemanggilan alat

Filter model

Model teratas menurut Skor Pemanggilan alat

Skor Pemanggilan alat vs total biaya

Model teratas menurut Waktu respons (rata-rata)