Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.6

Model terbaik

Qwen3.6 35B A3B 3.0

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah69 Dengan alasan kegagalan Tidak ada jawaban32 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

216/216

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#26	Claude Sonnet 5 medium	Anthropic	7.3	8.3	$0.922	1/2	51.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.922 Waktu respons (rata-rata) 51.9s
#182	GLM 4.7 Flash none	Z.ai	3.0	4.9	$0.016	0/2	50.2s
Total Tes 2 Tes Salah 2 Total Biaya $0.016 Waktu respons (rata-rata) 50.2s
#101	GLM 5.2 none	Z.ai	6.9	6.6	$0.128	1/2	50.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.128 Waktu respons (rata-rata) 50.2s
#194	Cobuddy medium	Baidu	1.5	4.7	$0.000	0/1	47.4s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 47.4s
#157	GLM 5.1 none	Z.ai	2.8	5.5	$0.164	0/2	46.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.164 Waktu respons (rata-rata) 46.9s
#106	Hy3 preview medium	Tencent	5.0	6.5	$0.018	1/1	46.0s
Total Tes 1 Tes Salah 0 Total Biaya $0.018 Waktu respons (rata-rata) 46.0s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	44.4s
Total Tes 2 Tes Salah 0 Total Biaya $0.642 Waktu respons (rata-rata) 44.4s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	43.4s
Total Tes 2 Tes Salah 0 Total Biaya $1.477 Waktu respons (rata-rata) 43.4s
#19	Muse Spark 1.1 medium	Meta	8.3	8.6	$1.357	1/2	42.6s
Total Tes 2 Tes Salah 1 Total Biaya $1.357 Waktu respons (rata-rata) 42.6s
#79	Grok 4.20 medium	X AI	8.7	7.1	$0.777	1/2	42.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.777 Waktu respons (rata-rata) 42.2s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	42.1s
Total Tes 2 Tes Salah 0 Total Biaya $0.831 Waktu respons (rata-rata) 42.1s
#90	Step 3.7 Flash high	Stepfun	8.7	6.9	$1.207	1/2	41.2s
Total Tes 2 Tes Salah 1 Total Biaya $1.207 Waktu respons (rata-rata) 41.2s
#36	Inkling medium	Thinkingmachines	7.3	8.0	$0.391	1/2	41.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.391 Waktu respons (rata-rata) 41.2s
#10	Gemini 3.1 Pro Preview medium	Google	9.8	9.2	$1.361	2/2	40.4s
Total Tes 2 Tes Salah 0 Total Biaya $1.361 Waktu respons (rata-rata) 40.4s
#167	Qwen3.6 35B A3B none	Qwen	3.8	5.3	$0.061	0/2	39.5s
Total Tes 2 Tes Salah 2 Total Biaya $0.061 Waktu respons (rata-rata) 39.5s

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)