Orodha ya modeli za Uandishi wa msimbo

Kategoria ya AI BENCHY

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Uandishi wa msimbo, zipi zinabaki thabiti, na pengo kubwa liko wapi.

Modeli zilizoonyeshwa

Wastani wa Alama ya Uandishi wa msimbo

5.7

Modeli bora

Gemini 3.5 Flash 10.0

Sababu za kushindwa

Kwa sababu ya kushindwa Jibu lisilo sahihi230 Kwa sababu ya kushindwa Hitilafu ya API43 Kwa sababu ya kushindwa Muda umeisha25 Kwa sababu ya kushindwa Hakuna jibu18 Kwa sababu ya kushindwa Hakufuata maelekezo16 Kwa sababu ya kushindwa Muundo wa ziada12

189/189

Nafasi	Modeli	Kampuni	Alama ya Uandishi wa msimbo	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#161	GLM 4.7 Flash none	Z.ai	4.3	4.9	$0.004	0/3	2.54s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.004 Muda wa majibu (wastani) 2.54s
#103	Gemma 4 31B medium	Google	4.3	6.3	$0.033	0/3	219.8s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.033 Muda wa majibu (wastani) 219.8s
#123	Qwen3.5 Plus 2026-02-15 none	Qwen	4.3	5.8	$0.016	0/3	2.05s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.016 Muda wa majibu (wastani) 2.05s
#179	MiMo-V2-Flash none	Xiaomi	4.3	4.3	$0.025	0/3	2.64s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.025 Muda wa majibu (wastani) 2.64s
#135	DeepSeek V4 Flash none	DeepSeek	4.2	5.5	$0.007	0/3	17.1s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.007 Muda wa majibu (wastani) 17.1s
#172	Elephant Alpha none	Openrouter	4.2	4.6	$0.000	0/3	1.39s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.000 Muda wa majibu (wastani) 1.39s
#118	GLM 5 none	Z.ai	4.0	6.0	$0.027	0/3	5.12s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.027 Muda wa majibu (wastani) 5.12s
#76	Step 3.7 Flash high	Stepfun	4.0	7.1	$1.148	0/3	206.2s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $1.148 Muda wa majibu (wastani) 206.2s
#140	Qwen3.5 Plus 2026-04-20 none	Qwen	3.9	5.5	$0.032	0/3	1.69s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.032 Muda wa majibu (wastani) 1.69s
#141	GLM 5 Turbo none	Z.ai	3.9	5.3	$0.047	0/3	2.41s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.047 Muda wa majibu (wastani) 2.41s
#155	Qwen3.5-9B none	Qwen	3.9	5.1	$0.006	0/3	5.60s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.006 Muda wa majibu (wastani) 5.60s
#151	North Mini Code none	Cohere	3.9	5.1	$0.000	0/3	22.0s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.000 Muda wa majibu (wastani) 22.0s
#134	GLM 5.1 none	Z.ai	3.9	5.6	$0.057	0/3	4.96s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.057 Muda wa majibu (wastani) 4.96s
#116	Qwen3.6 Max Preview none	Qwen	3.8	6.0	$0.075	0/3	3.12s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.075 Muda wa majibu (wastani) 3.12s
#167	Ling-2.6-1T none	Inclusionai	3.8	4.7	$0.005	0/3	10.6s
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.005 Muda wa majibu (wastani) 10.6s

←

1 9 10 11 13

→

Orodha ya Uandishi wa msimbo

Chuja miundo

Modeli bora kwa Alama ya Uandishi wa msimbo

Alama ya Uandishi wa msimbo dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)