Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Gemini 3 Flash Preview 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah412 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#113	MiMo-V2-Flash medium	Xiaomi	5.9	6.3	$0.043	1/3	96.0s
Total Tes 3 Tes Salah 2 Total Biaya $0.043 Waktu respons (rata-rata) 96.0s
#118	Gemini 2.5 Flash none	Google	5.9	6.2	$0.017	1/3	495ms
Total Tes 3 Tes Salah 2 Total Biaya $0.017 Waktu respons (rata-rata) 495ms
#153	Hy3 preview low	Tencent	5.9	5.5	$0.015	1/3	40.4s
Total Tes 3 Tes Salah 2 Total Biaya $0.015 Waktu respons (rata-rata) 40.4s
#203	Grok 4.1 Fast none	X AI	5.9	3.8	$0.008	1/3	1.06s
Total Tes 3 Tes Salah 2 Total Biaya $0.008 Waktu respons (rata-rata) 1.06s
#210	LFM2-24B-A2B none	Liquid	5.9	2.2	$0.001	1/3	287ms
Total Tes 3 Tes Salah 2 Total Biaya $0.001 Waktu respons (rata-rata) 287ms
#33	Kimi K3 max	Moonshot AI	5.9	8.0	$3.112	1/3	490.1s
Total Tes 3 Tes Salah 2 Total Biaya $3.112 Waktu respons (rata-rata) 490.1s
#185	Grok 4.1 Fast medium	X AI	5.8	4.7	$0.069	1/3	121.8s
Total Tes 3 Tes Salah 2 Total Biaya $0.069 Waktu respons (rata-rata) 121.8s
#47	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/3	233.1s
Total Tes 3 Tes Salah 2 Total Biaya $0.286 Waktu respons (rata-rata) 233.1s
#52	Kimi K2.7 Code medium	Moonshot AI	5.5	7.5	$0.751	1/3	213.3s
Total Tes 3 Tes Salah 2 Total Biaya $0.751 Waktu respons (rata-rata) 213.3s
#6	GPT-5.5 low	OpenAI	5.3	9.3	$1.253	1/3	28.1s
Total Tes 3 Tes Salah 2 Total Biaya $1.253 Waktu respons (rata-rata) 28.1s
#14	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
Total Tes 3 Tes Salah 2 Total Biaya $1.931 Waktu respons (rata-rata) 14.6s
#30	GPT-5.2 Chat none	OpenAI	5.3	8.0	$0.604	1/3	17.8s
Total Tes 3 Tes Salah 2 Total Biaya $0.604 Waktu respons (rata-rata) 17.8s
#34	GPT-5.6 Terra high	OpenAI	5.3	8.0	$1.055	1/3	43.4s
Total Tes 3 Tes Salah 2 Total Biaya $1.055 Waktu respons (rata-rata) 43.4s
#39	GPT-5.6 Terra medium	OpenAI	5.3	7.8	$0.676	1/3	23.4s
Total Tes 3 Tes Salah 2 Total Biaya $0.676 Waktu respons (rata-rata) 23.4s
#41	Claude Opus 4.8 low	Anthropic	5.3	7.8	$2.077	1/3	45.5s
Total Tes 3 Tes Salah 2 Total Biaya $2.077 Waktu respons (rata-rata) 45.5s

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)