Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Hy3 preview 3.0

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi62 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

216/216

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.082 Muda wa majibu (wastani) 5.37s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	1/1	5.78s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.750 Muda wa majibu (wastani) 5.78s
#187	Grok 4.20 Multi Agent Beta medium	X AI	5.8	4.8	$5.599	0/1	6.40s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $5.599 Muda wa majibu (wastani) 6.40s
#190	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 6.44s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	1/1	6.53s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.006 Muda wa majibu (wastani) 6.53s
#196	MiniMax M2.5 medium	Minimax	3.8	4.6	$0.340	0/1	6.63s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.340 Muda wa majibu (wastani) 6.63s
#33	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.515 Muda wa majibu (wastani) 6.85s
#174	MiMo-V2.5 none	Xiaomi	4.4	5.1	$0.025	0/1	6.86s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.025 Muda wa majibu (wastani) 6.86s
#146	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.055	0/1	6.91s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.055 Muda wa majibu (wastani) 6.91s
#71	Step 3.7 Flash low	Stepfun	3.4	7.3	$0.454	0/1	7.00s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.454 Muda wa majibu (wastani) 7.00s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	5.1	5.6	$0.077	0/1	7.10s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.077 Muda wa majibu (wastani) 7.10s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	1/1	7.42s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $3.478 Muda wa majibu (wastani) 7.42s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	1/1	7.73s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.694 Muda wa majibu (wastani) 7.73s
#127	gpt-oss-120b medium	OpenAI	4.3	6.1	$0.019	0/1	7.90s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.019 Muda wa majibu (wastani) 7.90s
#94	Qwen3.6 35B A3B medium	Qwen	4.4	6.7	$0.746	0/1	8.66s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.746 Muda wa majibu (wastani) 8.66s

←

1 9 10 11 15

→

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)