Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Claude Sonnet 4.6 2.9

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah421 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

216/216

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.09s
Total Tes 3 Tes Salah 2 Total Biaya $0.052 Waktu respons (rata-rata) 2.09s
#163	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
Total Tes 3 Tes Salah 2 Total Biaya $0.021 Waktu respons (rata-rata) 2.10s
#147	GLM 5 none	Z.ai	3.0	5.7	$0.041	0/3	2.24s
Total Tes 3 Tes Salah 3 Total Biaya $0.041 Waktu respons (rata-rata) 2.24s
#202	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 2.33s
#110	Gemini 3.1 Flash Lite Preview low	Google	5.3	6.5	$0.646	1/3	2.36s
Total Tes 3 Tes Salah 2 Total Biaya $0.646 Waktu respons (rata-rata) 2.36s
#162	Gemma 4 26B A4B none	Google	3.6	5.5	$0.015	0/3	2.49s
Total Tes 3 Tes Salah 3 Total Biaya $0.015 Waktu respons (rata-rata) 2.49s
#154	Owl Alpha none	Openrouter	5.3	5.6	$0.000	1/3	3.00s
Total Tes 3 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 3.00s
#158	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
Total Tes 3 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 3.03s
#69	Gemini 3.1 Flash Lite medium	Google	2.9	7.3	$0.117	0/3	3.16s
Total Tes 3 Tes Salah 3 Total Biaya $0.117 Waktu respons (rata-rata) 3.16s
#121	Gemma 4 31B none	Google	7.7	6.2	$0.021	2/3	3.22s
Total Tes 3 Tes Salah 1 Total Biaya $0.021 Waktu respons (rata-rata) 3.22s
#118	Claude Sonnet 5 none	Anthropic	5.3	6.3	$0.548	1/3	3.28s
Total Tes 3 Tes Salah 2 Total Biaya $0.548 Waktu respons (rata-rata) 3.28s
#14	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
Total Tes 3 Tes Salah 1 Total Biaya $0.433 Waktu respons (rata-rata) 3.39s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
Total Tes 3 Tes Salah 1 Total Biaya $0.661 Waktu respons (rata-rata) 3.54s
#95	Gemini 3.5 Flash-Lite low	Google	3.6	6.7	$0.145	0/3	3.63s
Total Tes 3 Tes Salah 3 Total Biaya $0.145 Waktu respons (rata-rata) 3.63s
#86	DeepSeek V4 Pro none	DeepSeek	5.3	6.9	$0.096	1/3	3.72s
Total Tes 3 Tes Salah 2 Total Biaya $0.096 Waktu respons (rata-rata) 3.72s

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)