Peringkat model Kecerdasan umum

Lihat model AI mana yang paling baik di Kecerdasan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Kecerdasan umum

6.1

Model terbaik

Grok 4.5 4.7

Alasan kegagalan

Dengan alasan kegagalan Tidak mengikuti instruksi78 Dengan alasan kegagalan Jawaban salah62 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4

216/216

Peringkat	Model	Perusahaan	Skor Kecerdasan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#86	DeepSeek V4 Pro none	DeepSeek	5.0	6.9	$0.096	0/1	2.05s
Total Tes 1 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 2.05s
#87	GPT-5.6 Sol none	OpenAI	6.5	6.9	$0.524	0/1	1.52s
Total Tes 1 Tes Salah 1 Total Biaya $0.524 Waktu respons (rata-rata) 1.52s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.5	6.9	$0.187	0/1	4.02s
Total Tes 1 Tes Salah 1 Total Biaya $0.187 Waktu respons (rata-rata) 4.02s
#89	Qwen3.6 Flash medium	Qwen	4.8	6.9	$0.738	0/1	9.88s
Total Tes 1 Tes Salah 1 Total Biaya $0.738 Waktu respons (rata-rata) 9.88s
#90	Step 3.7 Flash high	Stepfun	5.5	6.9	$1.207	0/1	4.17s
Total Tes 1 Tes Salah 1 Total Biaya $1.207 Waktu respons (rata-rata) 4.17s
#94	Qwen3.6 35B A3B medium	Qwen	4.4	6.7	$0.746	0/1	8.66s
Total Tes 1 Tes Salah 1 Total Biaya $0.746 Waktu respons (rata-rata) 8.66s
#95	Gemini 3.5 Flash-Lite low	Google	6.1	6.7	$0.145	0/1	1.71s
Total Tes 1 Tes Salah 1 Total Biaya $0.145 Waktu respons (rata-rata) 1.71s
#96	LongCat 2.0 low	Meituan	3.4	6.7	$0.391	0/1	22.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.391 Waktu respons (rata-rata) 22.5s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	4.8	6.7	$0.476	0/1	5.16s
Total Tes 1 Tes Salah 1 Total Biaya $0.476 Waktu respons (rata-rata) 5.16s
#101	GLM 5.2 none	Z.ai	6.1	6.6	$0.128	0/1	4.42s
Total Tes 1 Tes Salah 1 Total Biaya $0.128 Waktu respons (rata-rata) 4.42s
#102	LongCat 2.0 high	Meituan	5.1	6.6	$0.469	0/1	17.0s
Total Tes 1 Tes Salah 1 Total Biaya $0.469 Waktu respons (rata-rata) 17.0s
#103	Qwen3.6 Max Preview none	Qwen	4.3	6.6	$0.231	0/1	1.62s
Total Tes 1 Tes Salah 1 Total Biaya $0.231 Waktu respons (rata-rata) 1.62s
#104	Gemini 3.5 Flash-Lite medium	Google	5.4	6.5	$0.369	0/1	2.93s
Total Tes 1 Tes Salah 1 Total Biaya $0.369 Waktu respons (rata-rata) 2.93s
#105	Qwen3.6 27B medium	Qwen	6.5	6.5	$0.779	0/1	39.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.779 Waktu respons (rata-rata) 39.5s
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
Total Tes 1 Tes Salah 1 Total Biaya $0.082 Waktu respons (rata-rata) 5.37s

Peringkat Kecerdasan umum

Filter model

Model teratas menurut Skor Kecerdasan umum

Skor Kecerdasan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)