Orodha ya modeli za Akili ya jumla

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Akili ya jumla, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Akili ya jumla

6.1

Modeli bora

Hy3 preview 3.0

Sababu za kushindwa

Kwa sababu ya kushindwa Hakufuata maelekezo78 Kwa sababu ya kushindwa Jibu lisilo sahihi59 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muda umeisha4

210/210

Nafasi	Modeli	Kampuni	Alama ya Akili ya jumla	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#189	Mercury 2 none	Inception	4.8	4.6	$0.030	0/1	628ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.030 Muda wa majibu (wastani) 628ms
#197	Grok 4.20 none	X AI	4.8	4.1	$0.057	0/1	659ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.057 Muda wa majibu (wastani) 659ms
#165	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.022 Muda wa majibu (wastani) 729ms
#106	Gemini 3.1 Flash Lite Preview none	Google	4.0	6.4	$0.052	0/1	741ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.052 Muda wa majibu (wastani) 741ms
#151	GLM 5.1 none	Z.ai	5.0	5.5	$0.164	0/1	790ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.164 Muda wa majibu (wastani) 790ms
#120	Gemini 3.1 Flash Lite minimal	Google	4.0	6.1	$0.047	0/1	791ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.047 Muda wa majibu (wastani) 791ms
#125	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	803ms
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.073 Muda wa majibu (wastani) 803ms
#78	Mercury 2 medium	Inception	4.8	7.0	$0.093	0/1	821ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.093 Muda wa majibu (wastani) 821ms
#193	Elephant Alpha none	Openrouter	4.0	4.3	$0.000	0/1	854ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 854ms
#164	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.147 Muda wa majibu (wastani) 859ms
#183	Trinity Large Preview none	Arcee AI	4.5	4.8	$0.008	0/1	873ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.008 Muda wa majibu (wastani) 873ms
#174	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.010 Muda wa majibu (wastani) 909ms
#195	Elephant Alpha medium	Openrouter	4.3	4.3	$0.000	0/1	920ms
Jumla ya majaribio 1 Majaribio yenye makosa 1 Jumla ya gharama $0.000 Muda wa majibu (wastani) 920ms
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	1/1	922ms
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.300 Muda wa majibu (wastani) 922ms
#124	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	947ms
Jumla ya majaribio 1 Majaribio yenye makosa 0 Jumla ya gharama $0.062 Muda wa majibu (wastani) 947ms

Orodha ya Akili ya jumla

Chuja miundo

Modeli bora kwa Alama ya Akili ya jumla

Alama ya Akili ya jumla dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)