Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.6

Model terbaik

Gemini 3 PRO Preview 1.5

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah69 Dengan alasan kegagalan Tidak ada jawaban32 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

216/216

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#136	Step 3.5 Flash medium	Stepfun	6.5	6.0	$0.108	1/2	813.7s
Total Tes 2 Tes Salah 1 Total Biaya $0.108 Waktu respons (rata-rata) 813.7s
#142	GPT-5.4 Mini none	OpenAI	6.5	5.9	$0.095	1/2	6.22s
Total Tes 2 Tes Salah 1 Total Biaya $0.095 Waktu respons (rata-rata) 6.22s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	74.5s
Total Tes 2 Tes Salah 1 Total Biaya $0.077 Waktu respons (rata-rata) 74.5s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	19.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 19.6s
#168	Ling-2.6-1T none	Inclusionai	6.5	5.3	$0.016	1/2	23.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 23.8s
#27	Muse Spark 1.1 low	Meta	6.6	8.3	$0.647	1/2	29.4s
Total Tes 2 Tes Salah 1 Total Biaya $0.647 Waktu respons (rata-rata) 29.4s
#81	Kimi K2.5 medium	Moonshot AI	6.7	7.0	$0.600	1/2	89.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.600 Waktu respons (rata-rata) 89.2s
#82	Mercury 2 medium	Inception	6.7	7.0	$0.093	1/2	7.84s
Total Tes 2 Tes Salah 1 Total Biaya $0.093 Waktu respons (rata-rata) 7.84s
#105	Qwen3.6 27B medium	Qwen	6.7	6.5	$0.779	0/2	584.1s
Total Tes 2 Tes Salah 2 Total Biaya $0.779 Waktu respons (rata-rata) 584.1s
#60	GPT-5.4 Mini medium	OpenAI	6.9	7.5	$0.756	1/2	59.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.756 Waktu respons (rata-rata) 59.6s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	6.9	7.5	$0.437	1/2	175.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.437 Waktu respons (rata-rata) 175.8s
#72	Kimi K2.6 medium	Moonshot AI	6.9	7.2	$1.036	1/2	458.6s
Total Tes 2 Tes Salah 1 Total Biaya $1.036 Waktu respons (rata-rata) 458.6s
#88	MiMo-V2.5-Pro medium	Xiaomi	6.9	6.9	$0.187	1/2	125.4s
Total Tes 2 Tes Salah 1 Total Biaya $0.187 Waktu respons (rata-rata) 125.4s
#101	GLM 5.2 none	Z.ai	6.9	6.6	$0.128	1/2	50.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.128 Waktu respons (rata-rata) 50.2s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.2	7.3	$0.115	1/2	16.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.115 Waktu respons (rata-rata) 16.6s

←

1 9 10 11 15

→

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)