اینٹی اے آئی چالیں ماڈل درجہ بندی

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

اوسط اینٹی اے آئی چالیں اسکور

7.1

بہترین ماڈل

Gemini 3 Flash Preview 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ293 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ33 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ20 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	اینٹی اے آئی چالیں اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	4/4	23.5s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.928 ردِعمل کا وقت (اوسط) 23.5s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	4/4	3.80s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.922 ردِعمل کا وقت (اوسط) 3.80s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	4/4	12.7s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.006 ردِعمل کا وقت (اوسط) 12.7s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	4/4	5.80s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.970 ردِعمل کا وقت (اوسط) 5.80s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	4/4	10.2s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 10.2s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	4/4	8.58s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.267 ردِعمل کا وقت (اوسط) 8.58s
#37	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	4/4	9.90s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.405 ردِعمل کا وقت (اوسط) 9.90s
#38	GLM 5.2 medium	Z.ai	10.0	7.8	$0.222	4/4	5.89s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.222 ردِعمل کا وقت (اوسط) 5.89s
#41	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	4/4	3.30s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $2.077 ردِعمل کا وقت (اوسط) 3.30s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	4/4	23.7s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 23.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	4/4	4.82s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.323 ردِعمل کا وقت (اوسط) 4.82s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	4/4	8.62s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.774 ردِعمل کا وقت (اوسط) 8.62s
#60	LongCat 2.0 medium	Meituan	10.0	7.4	$0.478	4/4	9.65s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 9.65s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	4/4	3.48s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.177 ردِعمل کا وقت (اوسط) 3.48s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	4/4	10.8s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.317 ردِعمل کا وقت (اوسط) 10.8s

اینٹی اے آئی چالیں درجہ بندی

ماڈلز فلٹر کریں

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز