ڈومین مخصوص ماڈل درجہ بندی

دیکھیں کہ ڈومین مخصوص میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔

دکھائے گئے ماڈلز

اوسط ڈومین مخصوص اسکور

4.6

بہترین ماڈل

Gemini 3.6 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ467 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ43 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ18 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ9 ناکامی کی وجہ API خرابی کے ساتھ7 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ1

233/233

درجہ	ماڈل	کمپنی	ڈومین مخصوص اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#164	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	8.58s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 8.58s
#166	Owl Alpha none	Openrouter	5.3	5.6	$0.000	1/3	3.00s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 3.00s
#168	DeepSeek V4 Flash none	DeepSeek	5.3	5.6	$0.062	1/3	19.7s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.062 ردِعمل کا وقت (اوسط) 19.7s
#172	MiMo-V2.5-Pro none	Xiaomi	5.3	5.5	$0.068	1/3	877ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 877ms
#173	Kimi K2.5 none	Moonshot AI	5.3	5.5	$0.127	1/3	4.38s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.127 ردِعمل کا وقت (اوسط) 4.38s
#175	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.021 ردِعمل کا وقت (اوسط) 2.10s
#180	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/3	364ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 364ms
#183	Gemini 3.1 Flash Lite Preview high	Google	5.3	5.3	$2.310	1/3	127.6s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $2.310 ردِعمل کا وقت (اوسط) 127.6s
#184	Inkling none	Thinkingmachines	5.3	5.2	$0.147	1/3	1.45s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.147 ردِعمل کا وقت (اوسط) 1.45s
#185	Mistral Small 4 none	Mistral	5.3	5.1	$0.022	1/3	367ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.022 ردِعمل کا وقت (اوسط) 367ms
#186	Qwen3 Coder Next none	Qwen	5.3	5.1	$0.025	1/3	962ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 962ms
#190	GLM 5 Turbo none	Z.ai	5.3	5.1	$0.047	1/3	1.97s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 1.97s
#205	Trinity Large Preview none	Arcee AI	5.3	4.8	$0.008	1/3	877ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 877ms
#209	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.032	1/3	638ms
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.032 ردِعمل کا وقت (اوسط) 638ms
#219	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 2.33s

ڈومین مخصوص درجہ بندی

ماڈلز فلٹر کریں

ڈومین مخصوص اسکور کے لحاظ سے سرفہرست ماڈلز

ڈومین مخصوص اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز