Peringkat model Kecerdasan umum

Lihat model AI mana yang paling baik di Kecerdasan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Kecerdasan umum

6.1

Model terbaik

Grok 4.5 4.7

Alasan kegagalan

Dengan alasan kegagalan Tidak mengikuti instruksi78 Dengan alasan kegagalan Jawaban salah62 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4

216/216

Peringkat	Model	Perusahaan	Skor Kecerdasan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#164	KAT-Coder-Air V2.5 low	Kwaipilot	5.0	5.4	$0.041	0/1	10.1s
Total Tes 1 Tes Salah 1 Total Biaya $0.041 Waktu respons (rata-rata) 10.1s
#165	GPT-5.6 Luna none	OpenAI	5.0	5.4	$0.142	0/1	1.00s
Total Tes 1 Tes Salah 1 Total Biaya $0.142 Waktu respons (rata-rata) 1.00s
#166	Laguna XS 2.1 none	Poolside	5.0	5.3	$0.008	0/1	529ms
Total Tes 1 Tes Salah 1 Total Biaya $0.008 Waktu respons (rata-rata) 529ms
#167	Qwen3.6 35B A3B none	Qwen	4.4	5.3	$0.061	0/1	3.51s
Total Tes 1 Tes Salah 1 Total Biaya $0.061 Waktu respons (rata-rata) 3.51s
#168	Ling-2.6-1T none	Inclusionai	5.0	5.3	$0.016	0/1	20.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 20.3s
#170	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
Total Tes 1 Tes Salah 1 Total Biaya $0.147 Waktu respons (rata-rata) 859ms
#171	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
Total Tes 1 Tes Salah 1 Total Biaya $0.022 Waktu respons (rata-rata) 729ms
#173	Mistral Small 4 medium	Mistral	4.8	5.1	$0.096	0/1	2.05s
Total Tes 1 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 2.05s
#174	MiMo-V2.5 none	Xiaomi	4.4	5.1	$0.025	0/1	6.86s
Total Tes 1 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 6.86s
#175	Qwen3.5-9B none	Qwen	4.4	5.1	$0.021	0/1	552ms
Total Tes 1 Tes Salah 1 Total Biaya $0.021 Waktu respons (rata-rata) 552ms
#176	GLM 5 Turbo none	Z.ai	4.2	5.1	$0.047	0/1	2.18s
Total Tes 1 Tes Salah 1 Total Biaya $0.047 Waktu respons (rata-rata) 2.18s
#177	North Mini Code none	Cohere	3.9	5.1	$0.000	0/1	34.8s
Total Tes 1 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 34.8s
#178	MiniMax M2.7 medium	Minimax	3.9	5.0	$0.163	0/1	38.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.163 Waktu respons (rata-rata) 38.7s
#179	DeepSeek V3.2 none	DeepSeek	4.7	5.0	$0.054	0/1	9.32s
Total Tes 1 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 9.32s
#180	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
Total Tes 1 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 909ms

Peringkat Kecerdasan umum

Filter model

Model teratas menurut Skor Kecerdasan umum

Skor Kecerdasan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)