Peringkat model Pengetahuan umum

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pengetahuan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

Rata-rata Skor Pengetahuan umum

3.1

Model terbaik

Grok 4.20 Multi Agent Beta 0.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah133 Dengan alasan kegagalan Kesalahan API13 Dengan alasan kegagalan Tidak ada jawaban8

169/169

Peringkat	Model	Perusahaan	Skor Pengetahuan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total Tes 1 Tes Salah 1 Total Biaya $0.075 Waktu respons (rata-rata) 1.97s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
Total Tes 1 Tes Salah 1 Total Biaya $0.071 Waktu respons (rata-rata) 3.08s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
Total Tes 1 Tes Salah 1 Total Biaya $0.070 Waktu respons (rata-rata) 108.4s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.069 Waktu respons (rata-rata) 25.5s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
Total Tes 1 Tes Salah 1 Total Biaya $0.068 Waktu respons (rata-rata) 2.68s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
Total Tes 1 Tes Salah 1 Total Biaya $0.068 Waktu respons (rata-rata) 5.92s
#76	MiMo-V2.5 medium	Xiaomi	3.0	6.7	$0.063	0/1	51.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.063 Waktu respons (rata-rata) 51.3s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.059 Waktu respons (rata-rata) 47.7s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
Total Tes 1 Tes Salah 1 Total Biaya $0.058 Waktu respons (rata-rata) 2.34s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
Total Tes 1 Tes Salah 1 Total Biaya $0.058 Waktu respons (rata-rata) 2.58s
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
Total Tes 0 Tes Salah 0 Total Biaya $0.057 Waktu respons (rata-rata) 0ms
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
Total Tes 1 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 856ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
Total Tes 1 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 11.1s
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total Tes 1 Tes Salah 1 Total Biaya $0.052 Waktu respons (rata-rata) 2.23s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
Total Tes 1 Tes Salah 1 Total Biaya $0.047 Waktu respons (rata-rata) 2.37s

Peringkat Pengetahuan umum

Filter model

Model teratas menurut Skor Pengetahuan umum

Skor Pengetahuan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)