Orodha ya modeli za Utatuzi wa mafumbo

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Utatuzi wa mafumbo, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Kipimo ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Utatuzi wa mafumbo

6.7

Modeli bora

Step 3.5 Flash 0.0

Sababu za kushindwa

Kwa sababu ya kushindwa Jibu lisilo sahihi204 Kwa sababu ya kushindwa Hakufuata maelekezo90 Kwa sababu ya kushindwa Hitilafu ya API12 Kwa sababu ya kushindwa Muundo wa ziada8 Kwa sababu ya kushindwa Muda umeisha5 Kwa sababu ya kushindwa Hakuna jibu3

216/216

Nafasi	Modeli	Kampuni	Alama ya Utatuzi wa mafumbo	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#177	North Mini Code none	Cohere	3.5	5.1	$0.000	0/3	24.4s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.000 Muda wa majibu (wastani) 24.4s
#180	GPT-4o-mini none	OpenAI	3.5	5.0	$0.010	0/3	1.21s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.010 Muda wa majibu (wastani) 1.21s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	3.5	5.6	$0.077	0/3	2.47s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.077 Muda wa majibu (wastani) 2.47s
#189	Trinity Large Preview none	Arcee AI	3.6	4.8	$0.008	0/3	1.97s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.008 Muda wa majibu (wastani) 1.97s
#194	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.000 Muda wa majibu (wastani) 12.8s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	3.6	5.6	$0.048	0/3	1.87s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.048 Muda wa majibu (wastani) 1.87s
#133	Qwen3.5-35B-A3B none	Qwen	3.7	6.1	$0.106	0/3	1.35s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.106 Muda wa majibu (wastani) 1.35s
#148	Qwen3.5-122B-A10B none	Qwen	3.8	5.7	$0.247	0/3	1.00s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.247 Muda wa majibu (wastani) 1.00s
#216	LFM2-24B-A2B none	Liquid	3.8	2.2	$0.001	0/3	1.78s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.001 Muda wa majibu (wastani) 1.78s
#117	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.044 Muda wa majibu (wastani) 2.74s
#57	GPT-5.4 Nano medium	OpenAI	4.1	7.5	$0.138	0/3	3.79s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.138 Muda wa majibu (wastani) 3.79s
#199	Elephant Alpha none	Openrouter	4.2	4.3	$0.000	0/3	807ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.000 Muda wa majibu (wastani) 807ms
#122	Seed-2.0-Lite none	Bytedance Seed	5.3	6.2	$0.066	1/3	2.78s
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.066 Muda wa majibu (wastani) 2.78s
#127	gpt-oss-120b medium	OpenAI	5.3	6.1	$0.019	1/3	21.7s
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.019 Muda wa majibu (wastani) 21.7s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	3.40s
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.000 Muda wa majibu (wastani) 3.40s

Orodha ya Utatuzi wa mafumbo

Chuja miundo

Modeli bora kwa Alama ya Utatuzi wa mafumbo

Alama ya Utatuzi wa mafumbo dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)