Peringkat model Pemanggilan alat

Lihat model AI mana yang paling baik di Pemanggilan alat, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Rata-rata Skor Pemanggilan alat

8.8

Model terbaik

Ring-2.6-1T 10.0

Alasan kegagalan

Dengan alasan kegagalan Kesalahan API17 Dengan alasan kegagalan Pemanggilan alat tidak valid9 Dengan alasan kegagalan Tidak mengikuti instruksi8 Dengan alasan kegagalan Jawaban salah3 Dengan alasan kegagalan Tidak ada jawaban2

216/216

Peringkat	Model	Perusahaan	Skor Pemanggilan alat	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	1/1	8.21s
Total Tes 1 Tes Salah 0 Total Biaya $0.047 Waktu respons (rata-rata) 8.21s
#115	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	1/1	8.19s
Total Tes 1 Tes Salah 0 Total Biaya $0.333 Waktu respons (rata-rata) 8.19s
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	1/1	7.73s
Total Tes 1 Tes Salah 0 Total Biaya $2.310 Waktu respons (rata-rata) 7.73s
#55	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	1/1	7.72s
Total Tes 1 Tes Salah 0 Total Biaya $0.774 Waktu respons (rata-rata) 7.72s
#57	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	1/1	7.71s
Total Tes 1 Tes Salah 0 Total Biaya $0.138 Waktu respons (rata-rata) 7.71s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	1/1	7.56s
Total Tes 1 Tes Salah 0 Total Biaya $0.971 Waktu respons (rata-rata) 7.56s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	1/1	7.54s
Total Tes 1 Tes Salah 0 Total Biaya $0.437 Waktu respons (rata-rata) 7.54s
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	1/1	7.54s
Total Tes 1 Tes Salah 0 Total Biaya $0.009 Waktu respons (rata-rata) 7.54s
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	1/1	7.48s
Total Tes 1 Tes Salah 0 Total Biaya $2.057 Waktu respons (rata-rata) 7.48s
#62	Qwen3.5-27B medium	Qwen	10.0	7.4	$1.627	1/1	7.45s
Total Tes 1 Tes Salah 0 Total Biaya $1.627 Waktu respons (rata-rata) 7.45s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	1/1	7.40s
Total Tes 1 Tes Salah 0 Total Biaya $0.096 Waktu respons (rata-rata) 7.40s
#107	MiMo-V2.5 medium	Xiaomi	10.0	6.5	$0.082	1/1	7.29s
Total Tes 1 Tes Salah 0 Total Biaya $0.082 Waktu respons (rata-rata) 7.29s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	1/1	7.08s
Total Tes 1 Tes Salah 0 Total Biaya $1.234 Waktu respons (rata-rata) 7.08s
#182	GLM 4.7 Flash none	Z.ai	2.8	4.9	$0.016	0/1	7.05s
Total Tes 1 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 7.05s
#19	Muse Spark 1.1 medium	Meta	9.8	8.6	$1.357	1/1	6.99s
Total Tes 1 Tes Salah 0 Total Biaya $1.357 Waktu respons (rata-rata) 6.99s

Peringkat Pemanggilan alat

Filter model

Model teratas menurut Skor Pemanggilan alat

Skor Pemanggilan alat vs total biaya

Model teratas menurut Waktu respons (rata-rata)