Orodha ya modeli za Uchanganuzi na uchimbaji wa data

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Uchanganuzi na uchimbaji wa data, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Majaribio sahihi ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Uchanganuzi na uchimbaji wa data

8.9

Modeli bora

LongCat 2.0 3.6

Sababu za kushindwa

Kwa sababu ya kushindwa Jibu lisilo sahihi41 Kwa sababu ya kushindwa Hitilafu ya API14 Kwa sababu ya kushindwa Hakuna jibu8 Kwa sababu ya kushindwa Muundo wa ziada6 Kwa sababu ya kushindwa Muda umeisha1

210/210

Nafasi	Modeli	Kampuni	Alama ya Uchanganuzi na uchimbaji wa data	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#41	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $2.077 Muda wa majibu (wastani) 2.27s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.307 Muda wa majibu (wastani) 8.90s
#60	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.478 Muda wa majibu (wastani) 10.6s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $1.166 Muda wa majibu (wastani) 1.77s
#67	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.454 Muda wa majibu (wastani) 2.29s
#78	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.093 Muda wa majibu (wastani) 1.11s
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $1.079 Muda wa majibu (wastani) 8.10s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.467 Muda wa majibu (wastani) 4.70s
#84	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.187 Muda wa majibu (wastani) 18.8s
#91	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.391 Muda wa majibu (wastani) 10.8s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.018 Muda wa majibu (wastani) 5.25s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.103 Muda wa majibu (wastani) 37.4s
#109	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.333 Muda wa majibu (wastani) 17.2s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.043 Muda wa majibu (wastani) 0ms
#114	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
Jumla ya majaribio 2 Majaribio yenye makosa 1 Jumla ya gharama $0.139 Muda wa majibu (wastani) 57.0s

Orodha ya Uchanganuzi na uchimbaji wa data

Chuja miundo

Modeli bora kwa Alama ya Uchanganuzi na uchimbaji wa data

Alama ya Uchanganuzi na uchimbaji wa data dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)