کوڈنگ ماڈل درجہ بندی

AI BENCHY زمرہ

دیکھیں کہ کوڈنگ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔

دکھائے گئے ماڈلز

اوسط کوڈنگ اسکور

5.7

بہترین ماڈل

Gemini 3.5 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ230 ناکامی کی وجہ API خرابی کے ساتھ43 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ25 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ18 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ16 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ12

189/189

درجہ	ماڈل	کمپنی	کوڈنگ اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#161	GLM 4.7 Flash none	Z.ai	4.3	4.9	$0.004	0/3	2.54s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.004 ردِعمل کا وقت (اوسط) 2.54s
#103	Gemma 4 31B medium	Google	4.3	6.3	$0.033	0/3	219.8s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.033 ردِعمل کا وقت (اوسط) 219.8s
#123	Qwen3.5 Plus 2026-02-15 none	Qwen	4.3	5.8	$0.016	0/3	2.05s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 2.05s
#179	MiMo-V2-Flash none	Xiaomi	4.3	4.3	$0.025	0/3	2.64s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 2.64s
#135	DeepSeek V4 Flash none	DeepSeek	4.2	5.5	$0.007	0/3	17.1s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.007 ردِعمل کا وقت (اوسط) 17.1s
#172	Elephant Alpha none	Openrouter	4.2	4.6	$0.000	0/3	1.39s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 1.39s
#118	GLM 5 none	Z.ai	4.0	6.0	$0.027	0/3	5.12s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.027 ردِعمل کا وقت (اوسط) 5.12s
#76	Step 3.7 Flash high	Stepfun	4.0	7.1	$1.148	0/3	206.2s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $1.148 ردِعمل کا وقت (اوسط) 206.2s
#140	Qwen3.5 Plus 2026-04-20 none	Qwen	3.9	5.5	$0.032	0/3	1.69s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.032 ردِعمل کا وقت (اوسط) 1.69s
#141	GLM 5 Turbo none	Z.ai	3.9	5.3	$0.047	0/3	2.41s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 2.41s
#155	Qwen3.5-9B none	Qwen	3.9	5.1	$0.006	0/3	5.60s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.006 ردِعمل کا وقت (اوسط) 5.60s
#151	North Mini Code none	Cohere	3.9	5.1	$0.000	0/3	22.0s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 22.0s
#134	GLM 5.1 none	Z.ai	3.9	5.6	$0.057	0/3	4.96s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.057 ردِعمل کا وقت (اوسط) 4.96s
#116	Qwen3.6 Max Preview none	Qwen	3.8	6.0	$0.075	0/3	3.12s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.075 ردِعمل کا وقت (اوسط) 3.12s
#167	Ling-2.6-1T none	Inclusionai	3.8	4.7	$0.005	0/3	10.6s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.005 ردِعمل کا وقت (اوسط) 10.6s

←

1 9 10 11 13

→

کوڈنگ درجہ بندی

ماڈلز فلٹر کریں

کوڈنگ اسکور کے لحاظ سے سرفہرست ماڈلز

کوڈنگ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز