Orodha ya modeli za Mahususi kwa domeni

Ona ni modeli gani za AI zinafanya vizuri zaidi katika Mahususi kwa domeni, zipi zinabaki thabiti, na pengo kubwa liko wapi. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

Wastani wa Alama ya Mahususi kwa domeni

4.7

Modeli bora

Claude Sonnet 4.6 2.9

Sababu za kushindwa

Kwa sababu ya kushindwa Jibu lisilo sahihi412 Kwa sababu ya kushindwa Muda umeisha43 Kwa sababu ya kushindwa Muundo wa ziada17 Kwa sababu ya kushindwa Hakuna jibu8 Kwa sababu ya kushindwa Hitilafu ya API7 Kwa sababu ya kushindwa Hakufuata maelekezo1

210/210

Nafasi	Modeli	Kampuni	Alama ya Mahususi kwa domeni	Alama	Jumla ya gharama	Majaribio sahihi	Muda wa majibu (wastani)
#200	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	564ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.025 Muda wa majibu (wastani) 564ms
#191	Grok 4.20 Beta none	X AI	3.0	4.4	$0.087	0/3	611ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.087 Muda wa majibu (wastani) 611ms
#174	GPT-4o-mini none	OpenAI	3.0	5.0	$0.010	0/3	637ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.010 Muda wa majibu (wastani) 637ms
#187	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.032	1/3	638ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.032 Muda wa majibu (wastani) 638ms
#197	Grok 4.20 none	X AI	3.0	4.1	$0.057	0/3	687ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.057 Muda wa majibu (wastani) 687ms
#129	Nemotron 3 Ultra none	NVIDIA	5.3	6.1	$0.095	1/3	698ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.095 Muda wa majibu (wastani) 698ms
#159	GPT-5.6 Luna none	OpenAI	2.9	5.4	$0.142	0/3	737ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.142 Muda wa majibu (wastani) 737ms
#176	GLM 4.7 Flash none	Z.ai	7.7	4.9	$0.016	2/3	744ms
Jumla ya majaribio 3 Majaribio yenye makosa 1 Jumla ya gharama $0.016 Muda wa majibu (wastani) 744ms
#168	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.025	0/3	756ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.025 Muda wa majibu (wastani) 756ms
#132	GPT-5.6 Terra none	OpenAI	5.3	6.0	$0.349	1/3	757ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.349 Muda wa majibu (wastani) 757ms
#122	Gemini 3.1 Flash Lite none	Google	2.9	6.1	$0.046	0/3	762ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.046 Muda wa majibu (wastani) 762ms
#71	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.106	0/3	868ms
Jumla ya majaribio 3 Majaribio yenye makosa 3 Jumla ya gharama $0.106 Muda wa majibu (wastani) 868ms
#183	Trinity Large Preview none	Arcee AI	5.3	4.8	$0.008	1/3	877ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.008 Muda wa majibu (wastani) 877ms
#154	MiMo-V2.5-Pro none	Xiaomi	5.3	5.5	$0.068	1/3	877ms
Jumla ya majaribio 3 Majaribio yenye makosa 2 Jumla ya gharama $0.068 Muda wa majibu (wastani) 877ms
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	899ms
Jumla ya majaribio 3 Majaribio yenye makosa 0 Jumla ya gharama $0.300 Muda wa majibu (wastani) 899ms

Orodha ya Mahususi kwa domeni

Chuja miundo

Modeli bora kwa Alama ya Mahususi kwa domeni

Alama ya Mahususi kwa domeni dhidi ya jumla ya gharama

Modeli bora kwa Muda wa majibu (wastani)