اینٹی اے آئی چالیں ماڈل درجہ بندی

دیکھیں کہ اینٹی اے آئی چالیں میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط اینٹی اے آئی چالیں اسکور

7.2

بہترین ماڈل

Seed-2.0-Mini 6.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ293 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ33 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ20 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	اینٹی اے آئی چالیں اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	4/4	15.0s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.385 ردِعمل کا وقت (اوسط) 15.0s
#200	GLM 4.7 Flash medium	Z.ai	4.7	4.3	$0.166	1/4	15.0s
کل ٹیسٹس 4 غلط ٹیسٹس 3 کل لاگت $0.166 ردِعمل کا وقت (اوسط) 15.0s
#51	MiniMax M3 medium	Minimax	5.5	7.6	$0.286	1/4	14.9s
کل ٹیسٹس 4 غلط ٹیسٹس 3 کل لاگت $0.286 ردِعمل کا وقت (اوسط) 14.9s
#29	GPT-5 Mini medium	OpenAI	7.1	8.1	$0.237	2/4	13.9s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.237 ردِعمل کا وقت (اوسط) 13.9s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	4/4	13.4s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.207 ردِعمل کا وقت (اوسط) 13.4s
#116	Gemma 4 31B medium	Google	10.0	6.3	$0.107	4/4	12.9s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.107 ردِعمل کا وقت (اوسط) 12.9s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	4/4	12.7s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $1.006 ردِعمل کا وقت (اوسط) 12.7s
#105	Qwen3.6 27B medium	Qwen	8.3	6.5	$0.779	3/4	12.6s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 12.6s
#184	Ling-2.6-flash none	Inclusionai	6.8	4.9	$0.002	2/4	11.8s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.002 ردِعمل کا وقت (اوسط) 11.8s
#181	Qwen3.6 Plus Preview medium	Qwen	8.3	4.9	$0.000	3/4	11.7s
کل ٹیسٹس 4 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 11.7s
#72	Kimi K2.6 medium	Moonshot AI	7.0	7.2	$1.036	2/4	11.6s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $1.036 ردِعمل کا وقت (اوسط) 11.6s
#56	Kimi K2.7 Code medium	Moonshot AI	7.3	7.5	$0.740	2/4	11.6s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.740 ردِعمل کا وقت (اوسط) 11.6s
#205	Hy3 preview none	Tencent	4.8	4.0	$0.003	1/4	11.1s
کل ٹیسٹس 4 غلط ٹیسٹس 3 کل لاگت $0.003 ردِعمل کا وقت (اوسط) 11.1s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	4/4	10.8s
کل ٹیسٹس 4 غلط ٹیسٹس 0 کل لاگت $0.317 ردِعمل کا وقت (اوسط) 10.8s
#98	GLM 5V Turbo medium	Z.ai	7.2	6.7	$0.457	2/4	10.8s
کل ٹیسٹس 4 غلط ٹیسٹس 2 کل لاگت $0.457 ردِعمل کا وقت (اوسط) 10.8s

اینٹی اے آئی چالیں درجہ بندی

ماڈلز فلٹر کریں

اینٹی اے آئی چالیں اسکور کے لحاظ سے سرفہرست ماڈلز

اینٹی اے آئی چالیں اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز