Peringkat model Spesifik domain

Lihat model AI mana yang paling baik di Spesifik domain, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

Rata-rata Skor Spesifik domain

4.7

Model terbaik

Claude Sonnet 4.6 2.9

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah412 Dengan alasan kegagalan Kedaluwarsa43 Dengan alasan kegagalan Format tambahan17 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Kesalahan API7 Dengan alasan kegagalan Tidak mengikuti instruksi1

210/210

Peringkat	Model	Perusahaan	Skor Spesifik domain	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#40	Claude Sonnet 4.6 medium	Anthropic	2.9	7.8	$2.057	0/3	0ms
Total Tes 3 Tes Salah 3 Total Biaya $2.057 Waktu respons (rata-rata) 0ms
#42	GLM 5 medium	Z.ai	3.5	7.7	$0.307	0/3	0ms
Total Tes 3 Tes Salah 3 Total Biaya $0.307 Waktu respons (rata-rata) 0ms
#80	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.0	$0.101	0/3	0ms
Total Tes 3 Tes Salah 3 Total Biaya $0.101 Waktu respons (rata-rata) 0ms
#210	LFM2-24B-A2B none	Liquid	5.9	2.2	$0.001	1/3	287ms
Total Tes 3 Tes Salah 2 Total Biaya $0.001 Waktu respons (rata-rata) 287ms
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/3	357ms
Total Tes 3 Tes Salah 3 Total Biaya $0.007 Waktu respons (rata-rata) 357ms
#160	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/3	364ms
Total Tes 3 Tes Salah 2 Total Biaya $0.008 Waktu respons (rata-rata) 364ms
#165	Mistral Small 4 none	Mistral	5.3	5.1	$0.022	1/3	367ms
Total Tes 3 Tes Salah 2 Total Biaya $0.022 Waktu respons (rata-rata) 367ms
#205	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	371ms
Total Tes 3 Tes Salah 2 Total Biaya $0.004 Waktu respons (rata-rata) 371ms
#169	Qwen3.5-9B none	Qwen	3.0	5.1	$0.021	0/3	464ms
Total Tes 3 Tes Salah 3 Total Biaya $0.021 Waktu respons (rata-rata) 464ms
#142	Qwen3.5-122B-A10B none	Qwen	5.3	5.7	$0.247	1/3	465ms
Total Tes 3 Tes Salah 2 Total Biaya $0.247 Waktu respons (rata-rata) 465ms
#127	Qwen3.5-35B-A3B none	Qwen	7.7	6.1	$0.106	2/3	485ms
Total Tes 3 Tes Salah 1 Total Biaya $0.106 Waktu respons (rata-rata) 485ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.6	3.2	$0.000	0/3	489ms
Total Tes 3 Tes Salah 3 Total Biaya $0.000 Waktu respons (rata-rata) 489ms
#118	Gemini 2.5 Flash none	Google	5.9	6.2	$0.017	1/3	495ms
Total Tes 3 Tes Salah 2 Total Biaya $0.017 Waktu respons (rata-rata) 495ms
#189	Mercury 2 none	Inception	5.3	4.6	$0.030	1/3	534ms
Total Tes 3 Tes Salah 2 Total Biaya $0.030 Waktu respons (rata-rata) 534ms
#103	Qwen3.5-27B none	Qwen	3.0	6.5	$0.090	0/3	540ms
Total Tes 3 Tes Salah 3 Total Biaya $0.090 Waktu respons (rata-rata) 540ms

Peringkat Spesifik domain

Filter model

Model teratas menurut Skor Spesifik domain

Skor Spesifik domain vs total biaya

Model teratas menurut Waktu respons (rata-rata)