Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Kipimo ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Qwen3.5-35B-A3B 2.8

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi59 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

210/210

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#154	MiMo-V2.5-Pro none	Xiaomi	4.0	5.5	$0.068	0/1	2.58s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.068 Muda wa majibu (wastani) 2.58s
#156	Gemma 4 26B A4B none	Google	4.0	5.5	$0.015	0/1	3.54s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.015 Muda wa majibu (wastani) 3.54s
#165	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.022 Muda wa majibu (wastani) 729ms
#174	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.010 Muda wa majibu (wastani) 909ms
#176	GLM 4.7 Flash none	Z.ai	4.0	4.9	$0.016	0/1	1.59s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.016 Muda wa majibu (wastani) 1.59s
#178	Ling-2.6-flash none	Inclusionai	4.0	4.9	$0.002	0/1	1.45s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.002 Muda wa majibu (wastani) 1.45s
#193	Elephant Alpha none	Openrouter	4.0	4.3	$0.000	0/1	854ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 854ms
#201	Granite 4.1 8B none	IBM Granite	4.0	4.0	$0.007	0/1	499ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.007 Muda wa majibu (wastani) 499ms
#209	Step 3.5 Flash none	Stepfun	4.0	2.3	$0.020	0/1	14.4s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.020 Muda wa majibu (wastani) 14.4s
#210	LFM2-24B-A2B none	Liquid	4.0	2.2	$0.001	0/1	395ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.001 Muda wa majibu (wastani) 395ms
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/1	2.32s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.387 Muda wa majibu (wastani) 2.32s
#108	Ring-2.6-1T medium	Inclusionai	4.1	6.3	$0.103	0/1	58.3s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.103 Muda wa majibu (wastani) 58.3s
#128	GPT-5 Nano medium	OpenAI	4.1	6.1	$0.114	0/1	17.5s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.114 Muda wa majibu (wastani) 17.5s
#140	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.050	0/1	6.91s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.050 Muda wa majibu (wastani) 6.91s
#157	Mimo V2 Omni none	Xiaomi	4.1	5.5	$0.021	0/1	2.33s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.021 Muda wa majibu (wastani) 2.33s

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)