اینٹی اے آئی چالیں ماڈل درجہ بندی

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط اینٹی اے آئی چالیں اسکور

7.1

بہترین ماڈل

Seed-2.0-Mini 6.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ293 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ33 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ20 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	اینٹی اے آئی چالیں اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#45	DeepSeek V4 Flash high	DeepSeek	8.3	7.7	$0.042	3/4	28.5s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.042 ردِعمل کا وقت (اوسط) 28.5s
#46	DeepSeek V4 Pro high	DeepSeek	5.7	7.7	$0.200	1/4	25.7s
کل ٹیسٹس 4 غلط ٹیسٹس 3 کل لاگت $0.200 ردِعمل کا وقت (اوسط) 25.7s
#128	GPT-5 Nano medium	OpenAI	6.5	6.1	$0.114	2/4	25.5s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 25.5s
#76	DeepSeek V3.2 medium	DeepSeek	8.2	7.0	$0.078	3/4	24.2s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.078 ردِعمل کا وقت (اوسط) 24.2s
#42	GLM 5 medium	Z.ai	10.0	7.7	$0.307	4/4	23.7s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 23.7s
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	4/4	23.5s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.928 ردِعمل کا وقت (اوسط) 23.5s
#171	North Mini Code none	Cohere	3.0	5.1	$0.000	0/4	22.5s
کل ٹیسٹس 4 غلط ٹیسٹس 4 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 22.5s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	4/4	22.1s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.143 ردِعمل کا وقت (اوسط) 22.1s
#119	Qwen3.5-35B-A3B medium	Qwen	10.0	6.2	$0.837	4/4	21.1s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 21.1s
#190	MiniMax M2.5 medium	Minimax	7.9	4.6	$0.340	2/4	20.8s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 20.8s
#150	DeepSeek V4 Flash none	DeepSeek	3.0	5.6	$0.044	0/4	20.2s
کل ٹیسٹس 4 غلط ٹیسٹس 4 کل لاگت $0.044 ردِعمل کا وقت (اوسط) 20.2s
#58	Qwen3.5-27B medium	Qwen	8.7	7.4	$1.627	3/4	19.8s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $1.627 ردِعمل کا وقت (اوسط) 19.8s
#35	Seed-2.0-Lite medium	Bytedance Seed	8.3	7.9	$0.234	3/4	18.0s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.234 ردِعمل کا وقت (اوسط) 18.0s
#113	MiMo-V2-Flash medium	Xiaomi	8.1	6.3	$0.043	3/4	15.8s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 15.8s
#135	Hy3 preview high	Tencent	6.4	5.9	$0.048	2/4	15.1s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 15.1s

اینٹی اے آئی چالیں درجہ بندی

ماڈلز فلٹر کریں

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز