Peringkat model Pengetahuan umum

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pengetahuan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↑.

Model yang ditampilkan

Rata-rata Skor Pengetahuan umum

3.1

Model terbaik

North Mini Code 3.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah133 Dengan alasan kegagalan Kesalahan API13 Dengan alasan kegagalan Tidak ada jawaban8

169/169

Peringkat	Model	Perusahaan	Skor Pengetahuan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total Tes 1 Tes Salah 1 Total Biaya $0.007 Waktu respons (rata-rata) 3.07s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 731ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 777ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 399ms
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
Total Tes 1 Tes Salah 1 Total Biaya $0.009 Waktu respons (rata-rata) 601ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 47.3s
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total Tes 1 Tes Salah 1 Total Biaya $0.011 Waktu respons (rata-rata) 773ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total Tes 1 Tes Salah 1 Total Biaya $0.011 Waktu respons (rata-rata) 548ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total Tes 1 Tes Salah 1 Total Biaya $0.012 Waktu respons (rata-rata) 493ms
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.013 Waktu respons (rata-rata) 26.5s
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total Tes 1 Tes Salah 1 Total Biaya $0.013 Waktu respons (rata-rata) 733ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total Tes 1 Tes Salah 1 Total Biaya $0.013 Waktu respons (rata-rata) 724ms
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 649ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total Tes 1 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 599ms
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total Tes 1 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 1.15s

Peringkat Pengetahuan umum

Filter model

Model teratas menurut Skor Pengetahuan umum

Skor Pengetahuan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)