Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.5

Model terbaik

Gemini 3.5 Flash 3.0

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah68 Dengan alasan kegagalan Tidak ada jawaban29 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#79	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/2	0ms
Total Tes 2 Tes Salah 2 Total Biaya $1.079 Waktu respons (rata-rata) 0ms
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	0ms
Total Tes 2 Tes Salah 2 Total Biaya $0.026 Waktu respons (rata-rata) 0ms
#181	Grok 4.20 Multi Agent Beta medium	X AI	1.5	4.8	$5.599	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $5.599 Waktu respons (rata-rata) 0ms
#202	Grok Build 0.1 none	X AI	1.5	4.0	$0.547	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.547 Waktu respons (rata-rata) 0ms
#204	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/2	0ms
Total Tes 2 Tes Salah 2 Total Biaya $0.036 Waktu respons (rata-rata) 0ms
#206	gpt-oss-120b none	OpenAI	1.5	3.7	$0.010	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1.5	3.4	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1.5	3.2	$0.000	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 0ms
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.020 Waktu respons (rata-rata) 0ms
#210	LFM2-24B-A2B none	Liquid	1.5	2.2	$0.001	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.001 Waktu respons (rata-rata) 0ms
#205	Laguna Xs.2 none	Poolside	1.5	3.8	$0.004	0/1	2.01s
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 2.01s
#189	Mercury 2 none	Inception	3.0	4.6	$0.030	0/2	2.56s
Total Tes 2 Tes Salah 2 Total Biaya $0.030 Waktu respons (rata-rata) 2.56s
#200	MiMo-V2-Flash none	Xiaomi	1.5	4.0	$0.025	0/1	2.87s
Total Tes 1 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 2.87s
#203	Grok 4.1 Fast none	X AI	1.5	3.8	$0.008	0/1	3.33s
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 3.33s
#195	Elephant Alpha medium	Openrouter	1.5	4.3	$0.000	0/1	3.70s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 3.70s

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)