کوئی جواب نہیں ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں کوئی جواب نہیں سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Step 3.5 Flash 1

زمرے

زمرہ مشترکہ میں29 زمرہ کوڈنگ میں18 زمرہ معلومات عامہ میں13 زمرہ ڈومین مخصوص میں8 زمرہ ڈیٹا پارسنگ اور استخراج میں8 زمرہ اینٹی اے آئی چالیں میں4 زمرہ پہیلی حل کرنا میں3 زمرہ ٹول کالنگ میں2 زمرہ ہدایات کی پیروی میں2

67/67

درجہ	ماڈل	کمپنی	کوئی جواب نہیں کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#110	Gemma 4 31B medium	Google	1	6.3	$0.163	14/22	75.4s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 75.4s
#47	MiniMax M3 medium	Minimax	1	7.6	$0.286	12/22	75.0s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.286 ردِعمل کا وقت (اوسط) 75.0s
#190	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 68.3s
#86	Step 3.7 Flash high	Stepfun	4	6.9	$1.207	11/22	64.7s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $1.207 ردِعمل کا وقت (اوسط) 64.7s
#31	GLM 5.2 high	Z.ai	1	8.0	$0.970	14/22	62.7s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.970 ردِعمل کا وقت (اوسط) 62.7s
#143	Gemini 3.1 Flash Lite high	Google	1	5.6	$2.044	10/18	62.0s
کل ٹیسٹس 18 غلط ٹیسٹس 8 کل لاگت $2.044 ردِعمل کا وقت (اوسط) 62.0s
#90	Qwen3.6 35B A3B medium	Qwen	1	6.7	$0.746	13/22	58.1s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.746 ردِعمل کا وقت (اوسط) 58.1s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 54.9s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.050 ردِعمل کا وقت (اوسط) 52.0s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	7.9	$0.234	14/22	48.5s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.234 ردِعمل کا وقت (اوسط) 48.5s
#102	Laguna XS 2.1 medium	Poolside	1	6.5	$0.068	9/22	47.9s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 47.9s
#73	Grok 4.3 medium	X AI	1	7.1	$0.779	13/22	47.4s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 47.4s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.535 ردِعمل کا وقت (اوسط) 46.8s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 41.3s
#134	Mimo V2 Omni medium	Xiaomi	2	5.9	$0.683	10/21	41.2s
کل ٹیسٹس 21 غلط ٹیسٹس 11 کل لاگت $0.683 ردِعمل کا وقت (اوسط) 41.2s

←

1 2 3 4 5

→

کوئی جواب نہیں ناکامیاں

ماڈلز فلٹر کریں

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز