Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Gemini 3 Flash Preview 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah412 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#89	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	963ms
Total Tes 3 Tes Salah 1 Total Biaya $0.085 Waktu respons (rata-rata) 963ms
#94	Claude Opus 4.7 none	Anthropic	7.7	6.6	$0.505	2/3	1.19s
Total Tes 3 Tes Salah 1 Total Biaya $0.505 Waktu respons (rata-rata) 1.19s
#98	Qwen3.6 Max Preview none	Qwen	7.7	6.6	$0.231	2/3	1.22s
Total Tes 3 Tes Salah 1 Total Biaya $0.231 Waktu respons (rata-rata) 1.22s
#110	Gemma 4 31B medium	Google	7.7	6.3	$0.163	2/3	38.5s
Total Tes 3 Tes Salah 1 Total Biaya $0.163 Waktu respons (rata-rata) 38.5s
#115	Gemma 4 31B none	Google	7.7	6.2	$0.035	2/3	3.22s
Total Tes 3 Tes Salah 1 Total Biaya $0.035 Waktu respons (rata-rata) 3.22s
#125	Qwen3.5-Flash none	Qwen	7.7	6.1	$0.073	2/3	905ms
Total Tes 3 Tes Salah 1 Total Biaya $0.073 Waktu respons (rata-rata) 905ms
#127	Qwen3.5-35B-A3B none	Qwen	7.7	6.1	$0.106	2/3	485ms
Total Tes 3 Tes Salah 1 Total Biaya $0.106 Waktu respons (rata-rata) 485ms
#152	Qwen3.6 27B none	Qwen	7.7	5.5	$0.087	2/3	3.03s
Total Tes 3 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 3.03s
#176	GLM 4.7 Flash none	Z.ai	7.7	4.9	$0.016	2/3	744ms
Total Tes 3 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 744ms
#3	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
Total Tes 3 Tes Salah 2 Total Biaya $0.971 Waktu respons (rata-rata) 29.1s
#4	GPT-5.6 Sol medium	OpenAI	5.9	9.4	$1.316	1/3	47.9s
Total Tes 3 Tes Salah 2 Total Biaya $1.316 Waktu respons (rata-rata) 47.9s
#5	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
Total Tes 3 Tes Salah 2 Total Biaya $1.234 Waktu respons (rata-rata) 39.5s
#6	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
Total Tes 3 Tes Salah 2 Total Biaya $1.253 Waktu respons (rata-rata) 28.1s
#8	Qwen3.7 Max medium	Qwen	5.9	9.2	$1.116	1/3	24.9s
Total Tes 3 Tes Salah 2 Total Biaya $1.116 Waktu respons (rata-rata) 24.9s
#10	GPT-5.5 medium	OpenAI	5.3	9.0	$4.137	1/3	164.1s
Total Tes 3 Tes Salah 2 Total Biaya $4.137 Waktu respons (rata-rata) 164.1s

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)