Peringkat model Gabungan

Lihat model AI mana yang paling baik di Gabungan, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Gabungan

5.6

Model terbaik

Gemini 3.5 Flash 3.0

Alasan kegagalan

Dengan alasan kegagalan Pemanggilan alat tidak valid91 Dengan alasan kegagalan Jawaban salah69 Dengan alasan kegagalan Tidak ada jawaban32 Dengan alasan kegagalan Kesalahan API26 Dengan alasan kegagalan Kedaluwarsa5 Dengan alasan kegagalan Format tambahan1 Dengan alasan kegagalan Tidak mengikuti instruksi1

216/216

Peringkat	Model	Perusahaan	Skor Gabungan	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#204	Laguna Xs.2 medium	Poolside	1.5	4.1	$0.015	0/1	15.9s
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 15.9s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.2	7.3	$0.115	1/2	16.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.115 Waktu respons (rata-rata) 16.6s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	2/2	17.3s
Total Tes 2 Tes Salah 0 Total Biaya $0.517 Waktu respons (rata-rata) 17.3s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	17.6s
Total Tes 2 Tes Salah 0 Total Biaya $1.316 Waktu respons (rata-rata) 17.6s
#183	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.008	0/2	18.2s
Total Tes 2 Tes Salah 2 Total Biaya $0.008 Waktu respons (rata-rata) 18.2s
#99	Claude Opus 4.7 none	Anthropic	4.8	6.6	$0.505	1/1	18.3s
Total Tes 1 Tes Salah 0 Total Biaya $0.505 Waktu respons (rata-rata) 18.3s
#69	Gemini 3.1 Flash Lite medium	Google	7.2	7.3	$0.117	1/2	18.5s
Total Tes 2 Tes Salah 1 Total Biaya $0.117 Waktu respons (rata-rata) 18.5s
#48	GPT-5.6 Luna high	OpenAI	10.0	7.7	$1.017	2/2	19.0s
Total Tes 2 Tes Salah 0 Total Biaya $1.017 Waktu respons (rata-rata) 19.0s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	19.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 19.6s
#137	Grok 4.20 Beta medium	X AI	5.0	6.0	$0.750	1/1	20.9s
Total Tes 1 Tes Salah 0 Total Biaya $0.750 Waktu respons (rata-rata) 20.9s
#135	Nemotron 3 Ultra none	NVIDIA	3.0	6.1	$0.095	0/2	21.1s
Total Tes 2 Tes Salah 2 Total Biaya $0.095 Waktu respons (rata-rata) 21.1s
#154	Owl Alpha none	Openrouter	1.5	5.6	$0.000	0/1	21.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 21.7s
#129	Inkling low	Thinkingmachines	2.9	6.1	$0.187	0/2	22.7s
Total Tes 2 Tes Salah 2 Total Biaya $0.187 Waktu respons (rata-rata) 22.7s
#168	Ling-2.6-1T none	Inclusionai	6.5	5.3	$0.016	1/2	23.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 23.8s
#127	gpt-oss-120b medium	OpenAI	6.5	6.1	$0.019	1/2	24.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.019 Waktu respons (rata-rata) 24.0s

Peringkat Gabungan

Filter model

Model teratas menurut Skor Gabungan

Skor Gabungan vs total biaya

Model teratas menurut Waktu respons (rata-rata)