Peringkat model Pengetahuan umum

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pengetahuan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

Rata-rata Skor Pengetahuan umum

3.1

Model terbaik

Grok 4.20 Multi Agent Beta 0.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah133 Dengan alasan kegagalan Kesalahan API13 Dengan alasan kegagalan Tidak ada jawaban8

169/169

Peringkat	Model	Perusahaan	Skor Pengetahuan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 399ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 777ms
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 731ms
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total Tes 1 Tes Salah 1 Total Biaya $0.007 Waktu respons (rata-rata) 3.07s
#129	Mistral Small 4 none	Mistral	3.0	5.1	$0.007	0/1	397ms
Total Tes 1 Tes Salah 1 Total Biaya $0.007 Waktu respons (rata-rata) 397ms
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
Total Tes 1 Tes Salah 1 Total Biaya $0.007 Waktu respons (rata-rata) 3.89s
#142	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.007	0/1	8.94s
Total Tes 1 Tes Salah 1 Total Biaya $0.007 Waktu respons (rata-rata) 8.94s
#139	GPT-4o-mini none	OpenAI	3.0	5.0	$0.006	0/1	794ms
Total Tes 1 Tes Salah 1 Total Biaya $0.006 Waktu respons (rata-rata) 794ms
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
Total Tes 1 Tes Salah 1 Total Biaya $0.006 Waktu respons (rata-rata) 2.32s
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.005 Waktu respons (rata-rata) 0ms
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
Total Tes 1 Tes Salah 1 Total Biaya $0.005 Waktu respons (rata-rata) 588ms
#141	GLM 4.7 Flash none	Z.ai	3.0	4.9	$0.004	0/1	692ms
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 692ms
#121	Gemma 4 26B A4B none	Google	3.0	5.5	$0.004	0/1	778ms
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 778ms
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
Total Tes 1 Tes Salah 1 Total Biaya $0.004 Waktu respons (rata-rata) 1.25s
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Total Tes 1 Tes Salah 1 Total Biaya $0.003 Waktu respons (rata-rata) 306ms

←

1 9 10 11 12

→

Peringkat Pengetahuan umum

Filter model

Model teratas menurut Skor Pengetahuan umum

Skor Pengetahuan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)