پہیلی حل کرنا ماڈل درجہ بندی

دیکھیں کہ پہیلی حل کرنا میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط پہیلی حل کرنا اسکور

6.7

بہترین ماڈل

Muse Spark 1.1 7.8

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ214 ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ90 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ10 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ5 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ3

220/220

درجہ	ماڈل	کمپنی	پہیلی حل کرنا اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.103 ردِعمل کا وقت (اوسط) 20.7s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 20.6s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $0.082 ردِعمل کا وقت (اوسط) 20.3s
#143	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 19.7s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $1.097 ردِعمل کا وقت (اوسط) 18.3s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
کل ٹیسٹس 3 غلط ٹیسٹس 0 کل لاگت $1.046 ردِعمل کا وقت (اوسط) 17.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $0.317 ردِعمل کا وقت (اوسط) 17.7s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
کل ٹیسٹس 3 غلط ٹیسٹس 0 کل لاگت $0.267 ردِعمل کا وقت (اوسط) 16.4s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.237 ردِعمل کا وقت (اوسط) 15.2s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $1.017 ردِعمل کا وقت (اوسط) 14.6s
#42	GLM 5.2 medium	Z.ai	8.2	7.8	$0.182	2/3	13.1s
کل ٹیسٹس 3 غلط ٹیسٹس 1 کل لاگت $0.182 ردِعمل کا وقت (اوسط) 13.1s
#204	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/3	12.9s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.166 ردِعمل کا وقت (اوسط) 12.9s
#197	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
کل ٹیسٹس 3 غلط ٹیسٹس 3 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 12.8s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
کل ٹیسٹس 3 غلط ٹیسٹس 0 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 11.3s
#199	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
کل ٹیسٹس 3 غلط ٹیسٹس 2 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 11.2s

پہیلی حل کرنا درجہ بندی

ماڈلز فلٹر کریں

پہیلی حل کرنا اسکور کے لحاظ سے سرفہرست ماڈلز

پہیلی حل کرنا اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز