Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Gemini 3.6 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah421 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

216/216

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
Total Tes 3 Tes Salah 3 Total Biaya $0.249 Waktu respons (rata-rata) 10.0s
#149	Gemini 3.1 Flash Lite high	Google	3.6	5.6	$2.044	0/3	139.9s
Total Tes 3 Tes Salah 3 Total Biaya $2.044 Waktu respons (rata-rata) 139.9s
#162	Gemma 4 26B A4B none	Google	3.6	5.5	$0.015	0/3	2.49s
Total Tes 3 Tes Salah 3 Total Biaya $0.015 Waktu respons (rata-rata) 2.49s
#183	Nemotron 3 Super none	NVIDIA	3.6	4.9	$0.008	0/3	6.23s
Total Tes 3 Tes Salah 3 Total Biaya $0.008 Waktu respons (rata-rata) 6.23s
#198	Laguna M.1 none	Poolside	3.6	4.4	$0.009	0/3	5.50s
Total Tes 3 Tes Salah 3 Total Biaya $0.009 Waktu respons (rata-rata) 5.50s
#205	Hy3 preview none	Tencent	3.6	4.0	$0.003	0/3	17.6s
Total Tes 3 Tes Salah 3 Total Biaya $0.003 Waktu respons (rata-rata) 17.6s
#208	Grok Build 0.1 none	X AI	3.6	4.0	$0.547	0/3	103.7s
Total Tes 3 Tes Salah 3 Total Biaya $0.547 Waktu respons (rata-rata) 103.7s
#210	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/3	137.7s
Total Tes 3 Tes Salah 3 Total Biaya $0.036 Waktu respons (rata-rata) 137.7s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	3.2	$0.000	0/3	489ms
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 489ms
#19	Muse Spark 1.1 medium	Meta	3.5	8.6	$1.357	0/3	71.4s
Total Tes 3 Tes Salah 3 Total Biaya $1.357 Waktu respons (rata-rata) 71.4s
#30	Muse Spark 1.1 high	Meta	3.5	8.1	$1.694	0/3	67.4s
Total Tes 3 Tes Salah 3 Total Biaya $1.694 Waktu respons (rata-rata) 67.4s
#46	GLM 5 medium	Z.ai	3.5	7.7	$0.307	0/3	0ms
Total Tes 3 Tes Salah 3 Total Biaya $0.307 Waktu respons (rata-rata) 0ms
#55	Nemotron 3 Ultra medium	NVIDIA	3.5	7.5	$0.774	0/3	24.9s
Total Tes 3 Tes Salah 3 Total Biaya $0.774 Waktu respons (rata-rata) 24.9s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
Total Tes 3 Tes Salah 3 Total Biaya $0.571 Waktu respons (rata-rata) 13.0s
#81	Kimi K2.5 medium	Moonshot AI	3.5	7.0	$0.600	0/3	137.3s
Total Tes 3 Tes Salah 3 Total Biaya $0.600 Waktu respons (rata-rata) 137.3s

←

1 9 10 11 15

→

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)