Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Muda wa majibu (wastani) ↓.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Qwen3.5-9B 2.8

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi62 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

216/216

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#117	LongCat 2.0 none	Meituan	5.0	6.3	$0.044	0/1	2.76s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.044 Muda wa majibu (wastani) 2.76s
#202	Hunter Alpha none	OpenRouter	6.1	4.2	$0.000	0/1	2.71s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 2.71s
#69	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	1/1	2.60s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.117 Muda wa majibu (wastani) 2.60s
#160	MiMo-V2.5-Pro none	Xiaomi	4.0	5.5	$0.068	0/1	2.58s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.068 Muda wa majibu (wastani) 2.58s
#67	Claude Sonnet 4.6 none	Anthropic	6.1	7.3	$0.661	0/1	2.56s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.661 Muda wa majibu (wastani) 2.56s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	1/1	2.56s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.517 Muda wa majibu (wastani) 2.56s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	1/1	2.55s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $2.077 Muda wa majibu (wastani) 2.55s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	1/1	2.52s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.642 Muda wa majibu (wastani) 2.52s
#55	Nemotron 3 Ultra medium	NVIDIA	3.7	7.5	$0.774	0/1	2.52s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.774 Muda wa majibu (wastani) 2.52s
#109	Qwen3.5-27B none	Qwen	5.0	6.5	$0.090	0/1	2.51s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.090 Muda wa majibu (wastani) 2.51s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	1/1	2.46s
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $1.931 Muda wa majibu (wastani) 2.46s
#153	Mimo V2 PRO none	Xiaomi	4.3	5.6	$0.045	0/1	2.44s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.045 Muda wa majibu (wastani) 2.44s
#43	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.676 Muda wa majibu (wastani) 2.37s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	4.7	6.9	$0.467	0/1	2.35s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.467 Muda wa majibu (wastani) 2.35s
#163	Mimo V2 Omni none	Xiaomi	4.1	5.5	$0.021	0/1	2.33s
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.021 Muda wa majibu (wastani) 2.33s

←

1 9 10 11 15

→

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)