کوئی جواب نہیں ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں کوئی جواب نہیں سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Step 3.5 Flash 1

زمرے

زمرہ مشترکہ میں29 زمرہ کوڈنگ میں18 زمرہ معلومات عامہ میں13 زمرہ ڈومین مخصوص میں8 زمرہ ڈیٹا پارسنگ اور استخراج میں8 زمرہ اینٹی اے آئی چالیں میں4 زمرہ پہیلی حل کرنا میں3 زمرہ ٹول کالنگ میں2 زمرہ ہدایات کی پیروی میں2

67/67

درجہ	ماڈل	کمپنی	کوئی جواب نہیں کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
کل ٹیسٹس 21 غلط ٹیسٹس 10 کل لاگت $0.108 ردِعمل کا وقت (اوسط) 174.2s
#97	LongCat 2.0 high	Meituan	2	6.6	$0.469	9/22	148.7s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.469 ردِعمل کا وقت (اوسط) 148.7s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.166 ردِعمل کا وقت (اوسط) 142.6s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 136.6s
#33	Kimi K3 max	Moonshot AI	1	8.0	$3.112	16/22	122.5s
کل ٹیسٹس 22 غلط ٹیسٹس 6 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 122.5s
#119	Qwen3.5-35B-A3B medium	Qwen	2	6.2	$0.837	11/22	112.5s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 112.5s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $1.036 ردِعمل کا وقت (اوسط) 110.0s
#99	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 106.3s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
کل ٹیسٹس 22 غلط ٹیسٹس 8 کل لاگت $0.089 ردِعمل کا وقت (اوسط) 103.8s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 100.3s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.600 ردِعمل کا وقت (اوسط) 99.0s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	7.0	$0.101	11/22	92.5s
کل ٹیسٹس 22 غلط ٹیسٹس 11 کل لاگت $0.101 ردِعمل کا وقت (اوسط) 92.5s
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
کل ٹیسٹس 22 غلط ٹیسٹس 19 کل لاگت $0.036 ردِعمل کا وقت (اوسط) 82.2s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.200 ردِعمل کا وقت (اوسط) 79.1s
#12	Grok 4.5 high	X AI	2	8.9	$1.707	17/22	76.5s
کل ٹیسٹس 22 غلط ٹیسٹس 5 کل لاگت $1.707 ردِعمل کا وقت (اوسط) 76.5s

1 2 3 4 5

→

کوئی جواب نہیں ناکامیاں

ماڈلز فلٹر کریں

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز