Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.5

Model terbaik

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah68 Dengan alasan kegagalan Tidak ada jawaban29 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#82	DeepSeek V4 Pro none	DeepSeek	7.9	6.9	$0.096	1/2	71.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 71.6s
#19	Qwen3.6 Max Preview medium	Qwen	7.3	8.4	$1.143	1/2	177.5s
Total Tes 2 Tes Salah 1 Total Biaya $1.143 Waktu respons (rata-rata) 177.5s
#26	GPT-5 Mini medium	OpenAI	7.3	8.1	$0.237	1/2	99.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.237 Waktu respons (rata-rata) 99.8s
#28	Inkling high	Thinkingmachines	7.3	8.0	$1.006	1/2	63.8s
Total Tes 2 Tes Salah 1 Total Biaya $1.006 Waktu respons (rata-rata) 63.8s
#29	Step 3.7 Flash medium	Stepfun	7.3	8.0	$0.515	1/2	80.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.515 Waktu respons (rata-rata) 80.9s
#30	GPT-5.2 Chat none	OpenAI	7.3	8.0	$0.604	1/2	13.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.604 Waktu respons (rata-rata) 13.9s
#32	Inkling medium	Thinkingmachines	7.3	8.0	$0.391	1/2	41.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.391 Waktu respons (rata-rata) 41.2s
#52	Kimi K2.7 Code medium	Moonshot AI	7.3	7.5	$0.751	1/2	66.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.751 Waktu respons (rata-rata) 66.0s
#58	Qwen3.5-27B medium	Qwen	7.3	7.4	$1.627	1/2	595.2s
Total Tes 2 Tes Salah 1 Total Biaya $1.627 Waktu respons (rata-rata) 595.2s
#60	LongCat 2.0 medium	Meituan	7.3	7.4	$0.478	1/2	151.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.478 Waktu respons (rata-rata) 151.0s
#67	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	66.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.454 Waktu respons (rata-rata) 66.2s
#69	KAT-Coder-Pro V2.5 high	Kwaipilot	7.3	7.2	$0.482	1/2	106.7s
Total Tes 2 Tes Salah 1 Total Biaya $0.482 Waktu respons (rata-rata) 106.7s
#76	DeepSeek V3.2 medium	DeepSeek	7.3	7.0	$0.078	1/2	79.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.078 Waktu respons (rata-rata) 79.9s
#80	Seed-2.0-Mini medium	Bytedance Seed	7.3	7.0	$0.101	1/2	282.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.101 Waktu respons (rata-rata) 282.3s
#108	Ring-2.6-1T medium	Inclusionai	7.3	6.3	$0.103	1/2	257.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.103 Waktu respons (rata-rata) 257.3s

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)