Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.5

Model terbaik

Qwen3.6 35B A3B 3.0

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah68 Dengan alasan kegagalan Tidak ada jawaban29 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#90	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.746	0/2	817.6s
Total Tes 2 Tes Salah 2 Total Biaya $0.746 Waktu respons (rata-rata) 817.6s
#130	Step 3.5 Flash medium	Stepfun	6.5	6.0	$0.108	1/2	813.7s
Total Tes 2 Tes Salah 1 Total Biaya $0.108 Waktu respons (rata-rata) 813.7s
#194	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/2	802.8s
Total Tes 2 Tes Salah 2 Total Biaya $0.166 Waktu respons (rata-rata) 802.8s
#58	Qwen3.5-27B medium	Qwen	7.3	7.4	$1.627	1/2	595.2s
Total Tes 2 Tes Salah 1 Total Biaya $1.627 Waktu respons (rata-rata) 595.2s
#99	Qwen3.6 27B medium	Qwen	6.7	6.5	$0.779	0/2	584.1s
Total Tes 2 Tes Salah 2 Total Biaya $0.779 Waktu respons (rata-rata) 584.1s
#137	North Mini Code medium	Cohere	2.9	5.9	$0.000	0/2	554.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 554.9s
#119	Qwen3.5-35B-A3B medium	Qwen	3.8	6.2	$0.837	0/2	512.8s
Total Tes 2 Tes Salah 2 Total Biaya $0.837 Waktu respons (rata-rata) 512.8s
#95	Gemma 4 26B A4B medium	Google	6.3	6.6	$0.089	1/2	492.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.089 Waktu respons (rata-rata) 492.9s
#68	Kimi K2.6 medium	Moonshot AI	6.9	7.2	$1.036	1/2	458.6s
Total Tes 2 Tes Salah 1 Total Biaya $1.036 Waktu respons (rata-rata) 458.6s
#110	Gemma 4 31B medium	Google	2.9	6.3	$0.163	0/2	433.1s
Total Tes 2 Tes Salah 2 Total Biaya $0.163 Waktu respons (rata-rata) 433.1s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	2/2	321.5s
Total Tes 2 Tes Salah 0 Total Biaya $0.970 Waktu respons (rata-rata) 321.5s
#72	Qwen3.5-122B-A10B medium	Qwen	6.4	7.1	$1.046	1/2	313.5s
Total Tes 2 Tes Salah 1 Total Biaya $1.046 Waktu respons (rata-rata) 313.5s
#85	Qwen3.6 Flash medium	Qwen	6.5	6.9	$0.738	1/2	299.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.738 Waktu respons (rata-rata) 299.2s
#8	Qwen3.7 Max medium	Qwen	8.7	9.2	$1.116	1/2	287.8s
Total Tes 2 Tes Salah 1 Total Biaya $1.116 Waktu respons (rata-rata) 287.8s
#80	Seed-2.0-Mini medium	Bytedance Seed	7.3	7.0	$0.101	1/2	282.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.101 Waktu respons (rata-rata) 282.3s

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)