اینٹی اے آئی چالیں ماڈل درجہ بندی

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط اینٹی اے آئی چالیں اسکور

7.2

بہترین ماڈل

Mistral Small 4 3.4

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ293 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ33 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ20 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	اینٹی اے آئی چالیں اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	4/4	5.72s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.357 ردِعمل کا وقت (اوسط) 5.72s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	4/4	5.80s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.817 ردِعمل کا وقت (اوسط) 5.80s
#42	GLM 5.2 medium	Z.ai	10.0	7.8	$0.187	4/4	5.89s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.187 ردِعمل کا وقت (اوسط) 5.89s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	4/4	6.02s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.746 ردِعمل کا وقت (اوسط) 6.02s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	4/4	6.10s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.738 ردِعمل کا وقت (اوسط) 6.10s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	4/4	6.20s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.089 ردِعمل کا وقت (اوسط) 6.20s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	4/4	6.20s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $3.478 ردِعمل کا وقت (اوسط) 6.20s
#161	Kimi K2.5 none	Moonshot AI	3.6	5.5	$0.127	0/4	6.24s
کل ٹیسٹس 4 غلط ٹیسٹس 4 کل لاگت $0.127 ردِعمل کا وقت (اوسط) 6.24s
#208	Grok Build 0.1 none	X AI	8.7	4.0	$0.547	3/4	6.30s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.547 ردِعمل کا وقت (اوسط) 6.30s
#28	Gemini 2.5 Flash medium	Google	8.4	8.2	$0.643	3/4	6.30s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.643 ردِعمل کا وقت (اوسط) 6.30s
#11	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	4/4	6.36s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.116 ردِعمل کا وقت (اوسط) 6.36s
#36	Inkling medium	Thinkingmachines	8.7	8.0	$0.391	3/4	6.49s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 6.49s
#168	Ling-2.6-1T none	Inclusionai	3.4	5.3	$0.016	0/4	6.55s
کل ٹیسٹس 4 غلط ٹیسٹس 4 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 6.55s
#106	Hy3 preview medium	Tencent	10.0	6.5	$0.018	4/4	6.59s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 6.59s
#52	Grok Build 0.1 medium	X AI	8.3	7.6	$1.097	3/4	7.43s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $1.097 ردِعمل کا وقت (اوسط) 7.43s

←

1 9 10 11 15

→

اینٹی اے آئی چالیں درجہ بندی

ماڈلز فلٹر کریں

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز