Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Majaribio sahihi ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Grok 4.5 4.7

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi62 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

216/216

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#164	KAT-Coder-Air V2.5 low	Kwaipilot	5.0	5.4	$0.041	0/1	10.1s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.041 Muda wa majibu (wastani) 10.1s
#165	GPT-5.6 Luna none	OpenAI	5.0	5.4	$0.142	0/1	1.00s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.142 Muda wa majibu (wastani) 1.00s
#166	Laguna XS 2.1 none	Poolside	5.0	5.3	$0.008	0/1	529ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.008 Muda wa majibu (wastani) 529ms
#167	Qwen3.6 35B A3B none	Qwen	4.4	5.3	$0.061	0/1	3.51s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.061 Muda wa majibu (wastani) 3.51s
#168	Ling-2.6-1T none	Inclusionai	5.0	5.3	$0.016	0/1	20.3s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.016 Muda wa majibu (wastani) 20.3s
#170	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.147 Muda wa majibu (wastani) 859ms
#171	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.022 Muda wa majibu (wastani) 729ms
#173	Mistral Small 4 medium	Mistral	4.8	5.1	$0.096	0/1	2.05s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.096 Muda wa majibu (wastani) 2.05s
#174	MiMo-V2.5 none	Xiaomi	4.4	5.1	$0.025	0/1	6.86s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.025 Muda wa majibu (wastani) 6.86s
#175	Qwen3.5-9B none	Qwen	4.4	5.1	$0.021	0/1	552ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.021 Muda wa majibu (wastani) 552ms
#176	GLM 5 Turbo none	Z.ai	4.2	5.1	$0.047	0/1	2.18s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.047 Muda wa majibu (wastani) 2.18s
#177	North Mini Code none	Cohere	3.9	5.1	$0.000	0/1	34.8s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 34.8s
#178	MiniMax M2.7 medium	Minimax	3.9	5.0	$0.163	0/1	38.7s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.163 Muda wa majibu (wastani) 38.7s
#179	DeepSeek V3.2 none	DeepSeek	4.7	5.0	$0.054	0/1	9.32s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.054 Muda wa majibu (wastani) 9.32s
#180	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.010 Muda wa majibu (wastani) 909ms

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)