Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Hy3 preview 3.0

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi62 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

216/216

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#176	GLM 5 Turbo none	Z.ai	4.2	5.1	$0.047	0/1	2.18s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.047 Muda wa majibu (wastani) 2.18s
#151	GLM 5V Turbo none	Z.ai	4.6	5.6	$0.052	0/1	2.22s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.052 Muda wa majibu (wastani) 2.22s
#123	GPT-5.6 Luna low	OpenAI	5.0	6.2	$0.249	0/1	2.25s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.249 Muda wa majibu (wastani) 2.25s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	4.4	6.4	$0.073	0/1	2.26s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.073 Muda wa majibu (wastani) 2.26s
#14	Gemini 3.5 Flash low	Google	10.0	8.9	$0.433	1/1	2.27s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.433 Muda wa majibu (wastani) 2.27s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/1	2.32s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.387 Muda wa majibu (wastani) 2.32s
#163	Mimo V2 Omni none	Xiaomi	4.1	5.5	$0.021	0/1	2.33s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.021 Muda wa majibu (wastani) 2.33s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	4.7	6.9	$0.467	0/1	2.35s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.467 Muda wa majibu (wastani) 2.35s
#43	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.676 Muda wa majibu (wastani) 2.37s
#153	Mimo V2 PRO none	Xiaomi	4.3	5.6	$0.045	0/1	2.44s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.045 Muda wa majibu (wastani) 2.44s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	2.46s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.931 Muda wa majibu (wastani) 2.46s
#109	Qwen3.5-27B none	Qwen	5.0	6.5	$0.090	0/1	2.51s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.090 Muda wa majibu (wastani) 2.51s
#55	Nemotron 3 Ultra medium	NVIDIA	3.7	7.5	$0.774	0/1	2.52s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.774 Muda wa majibu (wastani) 2.52s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	1/1	2.52s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.642 Muda wa majibu (wastani) 2.52s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	1/1	2.55s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $2.077 Muda wa majibu (wastani) 2.55s

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)