Peringkat model Pengetahuan umum

Kategori AI BENCHY

Lihat model AI mana yang paling baik di Pengetahuan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul.

Model yang ditampilkan

Rata-rata Skor Pengetahuan umum

3.1

Model terbaik

Gemini 3.5 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah133 Dengan alasan kegagalan Kesalahan API13 Dengan alasan kegagalan Tidak ada jawaban8

169/169

Peringkat	Model	Perusahaan	Skor Pengetahuan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
Total Tes 1 Tes Salah 1 Total Biaya $1.210 Waktu respons (rata-rata) 14.0s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.175 Waktu respons (rata-rata) 48.3s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
Total Tes 1 Tes Salah 1 Total Biaya $0.393 Waktu respons (rata-rata) 6.89s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
Total Tes 1 Tes Salah 1 Total Biaya $0.376 Waktu respons (rata-rata) 114.0s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
Total Tes 1 Tes Salah 1 Total Biaya $0.323 Waktu respons (rata-rata) 40.2s
#22	GPT-5.2 medium	OpenAI	3.0	8.4	$0.548	0/1	28.2s
Total Tes 1 Tes Salah 1 Total Biaya $0.548 Waktu respons (rata-rata) 28.2s
#23	DeepSeek V4 Flash high	DeepSeek	3.0	8.3	$0.027	0/1	54.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.027 Waktu respons (rata-rata) 54.5s
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
Total Tes 1 Tes Salah 1 Total Biaya $0.379 Waktu respons (rata-rata) 2.76s
#25	Qwen3.7 Plus medium	Qwen	3.0	8.2	$0.177	0/1	91.1s
Total Tes 1 Tes Salah 1 Total Biaya $0.177 Waktu respons (rata-rata) 91.1s
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.0	8.1	$0.158	0/1	38.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.158 Waktu respons (rata-rata) 38.5s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
Total Tes 1 Tes Salah 1 Total Biaya $0.526 Waktu respons (rata-rata) 30.1s
#28	Qwen3.5 Plus 2026-02-15 medium	Qwen	3.0	8.0	$0.310	0/1	103.8s
Total Tes 1 Tes Salah 1 Total Biaya $0.310 Waktu respons (rata-rata) 103.8s
#29	Qwen3.5-27B medium	Qwen	3.0	7.9	$0.536	0/1	85.1s
Total Tes 1 Tes Salah 1 Total Biaya $0.536 Waktu respons (rata-rata) 85.1s
#30	Qwen3.6 Plus medium	Qwen	3.0	7.8	$0.294	0/1	47.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.294 Waktu respons (rata-rata) 47.5s
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
Total Tes 1 Tes Salah 1 Total Biaya $1.418 Waktu respons (rata-rata) 30.1s

Peringkat Pengetahuan umum

Filter model

Model teratas menurut Skor Pengetahuan umum

Skor Pengetahuan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)