Peringkat model Kecerdasan umum

Lihat model AI mana yang paling baik di Kecerdasan umum, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Kecerdasan umum

6.1

Model terbaik

Grok 4.5 4.7

Alasan kegagalan

Dengan alasan kegagalan Tidak mengikuti instruksi78 Dengan alasan kegagalan Jawaban salah66 Dengan alasan kegagalan Kesalahan API12 Dengan alasan kegagalan Kedaluwarsa4

220/220

Peringkat	Model	Perusahaan	Skor Kecerdasan umum	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#64	LongCat 2.0 medium	Meituan	4.8	7.4	$0.478	0/1	16.4s
Total Tes 1 Tes Salah 1 Total Biaya $0.478 Waktu respons (rata-rata) 16.4s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/1	2.32s
Total Tes 1 Tes Salah 1 Total Biaya $0.387 Waktu respons (rata-rata) 2.32s
#67	Claude Sonnet 4.6 none	Anthropic	6.1	7.3	$0.661	0/1	2.56s
Total Tes 1 Tes Salah 1 Total Biaya $0.661 Waktu respons (rata-rata) 2.56s
#71	Step 3.7 Flash low	Stepfun	3.4	7.3	$0.454	0/1	7.00s
Total Tes 1 Tes Salah 1 Total Biaya $0.454 Waktu respons (rata-rata) 7.00s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	5.1	7.2	$0.482	0/1	3.27s
Total Tes 1 Tes Salah 1 Total Biaya $0.482 Waktu respons (rata-rata) 3.27s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	4.9	7.2	$0.317	0/1	25.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.317 Waktu respons (rata-rata) 25.3s
#75	Qwen3.7 Plus none	Qwen	5.3	7.2	$0.106	0/1	1.33s
Total Tes 1 Tes Salah 1 Total Biaya $0.106 Waktu respons (rata-rata) 1.33s
#76	Qwen3.5-122B-A10B medium	Qwen	3.4	7.1	$1.046	0/1	34.1s
Total Tes 1 Tes Salah 1 Total Biaya $1.046 Waktu respons (rata-rata) 34.1s
#77	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.779 Waktu respons (rata-rata) 24.7s
#79	Grok 4.20 medium	X AI	3.9	7.1	$0.777	0/1	24.5s
Total Tes 1 Tes Salah 1 Total Biaya $0.777 Waktu respons (rata-rata) 24.5s
#80	DeepSeek V3.2 medium	DeepSeek	3.4	7.0	$0.078	0/1	58.3s
Total Tes 1 Tes Salah 1 Total Biaya $0.078 Waktu respons (rata-rata) 58.3s
#81	Kimi K2.5 medium	Moonshot AI	6.5	7.0	$0.600	0/1	69.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.600 Waktu respons (rata-rata) 69.7s
#82	Mercury 2 medium	Inception	4.8	7.0	$0.093	0/1	821ms
Total Tes 1 Tes Salah 1 Total Biaya $0.093 Waktu respons (rata-rata) 821ms
#84	Seed-2.0-Mini medium	Bytedance Seed	5.1	7.0	$0.101	0/1	36.7s
Total Tes 1 Tes Salah 1 Total Biaya $0.101 Waktu respons (rata-rata) 36.7s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	4.7	6.9	$0.467	0/1	2.35s
Total Tes 1 Tes Salah 1 Total Biaya $0.467 Waktu respons (rata-rata) 2.35s

Peringkat Kecerdasan umum

Filter model

Model teratas menurut Skor Kecerdasan umum

Skor Kecerdasan umum vs total biaya

Model teratas menurut Waktu respons (rata-rata)