Peringkat model Pemanggilan alat

Lihat model AI mana yang paling baik di Pemanggilan alat, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Rata-rata Skor Pemanggilan alat

8.8

Model terbaik

Ring-2.6-1T 10.0

Alasan kegagalan

Dengan alasan kegagalan Kesalahan API17 Dengan alasan kegagalan Pemanggilan alat tidak valid9 Dengan alasan kegagalan Tidak mengikuti instruksi8 Dengan alasan kegagalan Jawaban salah3 Dengan alasan kegagalan Tidak ada jawaban2

216/216

Peringkat	Model	Perusahaan	Skor Pemanggilan alat	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#24	GPT-5.2 medium	OpenAI	4.7	8.4	$0.951	0/1	10.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.951 Waktu respons (rata-rata) 10.3s
#102	LongCat 2.0 high	Meituan	10.0	6.6	$0.469	1/1	10.0s
Total Tes 1 Tes Salah 0 Total Biaya $0.469 Waktu respons (rata-rata) 10.0s
#30	Muse Spark 1.1 high	Meta	9.6	8.1	$1.694	1/1	9.88s
Total Tes 1 Tes Salah 0 Total Biaya $1.694 Waktu respons (rata-rata) 9.88s
#53	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	1/1	9.84s
Total Tes 1 Tes Salah 0 Total Biaya $0.323 Waktu respons (rata-rata) 9.84s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	1/1	9.76s
Total Tes 1 Tes Salah 0 Total Biaya $1.785 Waktu respons (rata-rata) 9.76s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	1/1	9.73s
Total Tes 1 Tes Salah 0 Total Biaya $3.059 Waktu respons (rata-rata) 9.73s
#60	GPT-5.4 Mini medium	OpenAI	4.7	7.5	$0.756	0/1	9.62s
Total Tes 1 Tes Salah 1 Total Biaya $0.756 Waktu respons (rata-rata) 9.62s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	1/1	9.54s
Total Tes 1 Tes Salah 0 Total Biaya $0.646 Waktu respons (rata-rata) 9.54s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	1/1	9.25s
Total Tes 1 Tes Salah 0 Total Biaya $0.817 Waktu respons (rata-rata) 9.25s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	9.01s
Total Tes 1 Tes Salah 0 Total Biaya $0.089 Waktu respons (rata-rata) 9.01s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	8.96s
Total Tes 1 Tes Salah 0 Total Biaya $1.931 Waktu respons (rata-rata) 8.96s
#72	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	1/1	8.92s
Total Tes 1 Tes Salah 0 Total Biaya $1.036 Waktu respons (rata-rata) 8.92s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	1/1	8.55s
Total Tes 1 Tes Salah 0 Total Biaya $0.831 Waktu respons (rata-rata) 8.55s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	1/1	8.36s
Total Tes 1 Tes Salah 0 Total Biaya $0.571 Waktu respons (rata-rata) 8.36s
#152	Owl Alpha medium	Openrouter	10.0	5.6	$0.000	1/1	8.26s
Total Tes 1 Tes Salah 0 Total Biaya $0.000 Waktu respons (rata-rata) 8.26s

Peringkat Pemanggilan alat

Filter model

Model teratas menurut Skor Pemanggilan alat

Skor Pemanggilan alat vs total biaya

Model teratas menurut Waktu respons (rata-rata)