Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi59 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

210/210

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	1/1	3.68s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.177 Muda wa majibu (wastani) 3.68s
#64	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	1/1	3.16s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.115 Muda wa majibu (wastani) 3.16s
#65	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	1/1	2.60s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.117 Muda wa majibu (wastani) 2.60s
#66	Claude Opus 4.8 none	Anthropic	10.0	7.3	$1.166	1/1	3.48s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.166 Muda wa majibu (wastani) 3.48s
#68	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	1/1	17.8s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.036 Muda wa majibu (wastani) 17.8s
#74	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	1/1	20.9s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.535 Muda wa majibu (wastani) 20.9s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	1/1	3.46s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.079 Muda wa majibu (wastani) 3.46s
#87	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	1/1	3.41s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.544 Muda wa majibu (wastani) 3.41s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	1/1	922ms
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.300 Muda wa majibu (wastani) 922ms
#89	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	1/1	1.13s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.085 Muda wa majibu (wastani) 1.13s
#93	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	1/1	11.1s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.457 Muda wa majibu (wastani) 11.1s
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	1/1	3.47s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.505 Muda wa majibu (wastani) 3.47s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	29.8s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.089 Muda wa majibu (wastani) 29.8s
#100	Hy3 preview medium	Tencent	10.0	6.5	$0.018	1/1	16.8s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.018 Muda wa majibu (wastani) 16.8s
#109	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	1/1	4.92s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.333 Muda wa majibu (wastani) 4.92s

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)