Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Gemini 3 Flash Preview 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah412 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#110	Gemma 4 31B medium	Google	7.7	6.3	$0.163	2/3	38.5s
Total Tes 3 Tes Salah 1 Total Biaya $0.163 Waktu respons (rata-rata) 38.5s
#115	Gemma 4 31B none	Google	7.7	6.2	$0.035	2/3	3.22s
Total Tes 3 Tes Salah 1 Total Biaya $0.035 Waktu respons (rata-rata) 3.22s
#125	Qwen3.5-Flash none	Qwen	7.7	6.1	$0.073	2/3	905ms
Total Tes 3 Tes Salah 1 Total Biaya $0.073 Waktu respons (rata-rata) 905ms
#127	Qwen3.5-35B-A3B none	Qwen	7.7	6.1	$0.106	2/3	485ms
Total Tes 3 Tes Salah 1 Total Biaya $0.106 Waktu respons (rata-rata) 485ms
#152	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
Total Tes 3 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 3.03s
#176	GLM 4.7 Flash none	Z.ai	7.7	4.9	$0.016	2/3	744ms
Total Tes 3 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 744ms
#2	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
Total Tes 3 Tes Salah 1 Total Biaya $1.976 Waktu respons (rata-rata) 14.1s
#79	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
Total Tes 3 Tes Salah 1 Total Biaya $1.079 Waktu respons (rata-rata) 10.6s
#4	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
Total Tes 3 Tes Salah 2 Total Biaya $1.316 Waktu respons (rata-rata) 47.9s
#8	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
Total Tes 3 Tes Salah 2 Total Biaya $1.116 Waktu respons (rata-rata) 24.9s
#13	GPT-5.3-Codex medium	OpenAI	5.9	8.9	$0.920	1/3	64.3s
Total Tes 3 Tes Salah 2 Total Biaya $0.920 Waktu respons (rata-rata) 64.3s
#21	GPT-5.2 medium	OpenAI	5.9	8.4	$0.951	1/3	77.8s
Total Tes 3 Tes Salah 2 Total Biaya $0.951 Waktu respons (rata-rata) 77.8s
#25	Gemini 2.5 Flash medium	Google	5.9	8.2	$0.643	1/3	37.3s
Total Tes 3 Tes Salah 2 Total Biaya $0.643 Waktu respons (rata-rata) 37.3s
#35	Seed-2.0-Lite medium	Bytedance Seed	5.9	7.9	$0.234	1/3	88.7s
Total Tes 3 Tes Salah 2 Total Biaya $0.234 Waktu respons (rata-rata) 88.7s
#53	GPT-5.4 Nano medium	OpenAI	5.9	7.5	$0.138	1/3	38.2s
Total Tes 3 Tes Salah 2 Total Biaya $0.138 Waktu respons (rata-rata) 38.2s

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)