کوئی جواب نہیں ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں کوئی جواب نہیں سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Qwen3.5-9B 2

زمرے

زمرہ مشترکہ میں29 زمرہ کوڈنگ میں18 زمرہ معلومات عامہ میں13 زمرہ ڈومین مخصوص میں8 زمرہ ڈیٹا پارسنگ اور استخراج میں8 زمرہ اینٹی اے آئی چالیں میں4 زمرہ پہیلی حل کرنا میں3 زمرہ ٹول کالنگ میں2 زمرہ ہدایات کی پیروی میں2

67/67

درجہ	ماڈل	کمپنی	کوئی جواب نہیں کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
کل ٹیسٹس 22 غلط ٹیسٹس 19 کل لاگت $0.036 ردِعمل کا وقت (اوسط) 82.2s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.061 ردِعمل کا وقت (اوسط) 5.52s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 2.57s
#187	Qwen3 Coder Next medium	Qwen	1	4.7	$0.032	4/22	9.61s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.032 ردِعمل کا وقت (اوسط) 9.61s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.166 ردِعمل کا وقت (اوسط) 142.6s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.4	$0.000	4/19	17.1s
کل ٹیسٹس 19 غلط ٹیسٹس 15 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 17.1s
#166	Qwen3 Coder Next none	Qwen	1	5.1	$0.025	5/22	9.12s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 9.12s
#167	Mistral Small 4 medium	Mistral	1	5.1	$0.096	5/22	10.8s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 10.8s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 4.62s
#172	MiniMax M2.7 medium	Minimax	2	5.0	$0.163	5/22	41.3s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 41.3s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 1.99s
#190	MiniMax M2.5 medium	Minimax	2	4.6	$0.340	5/22	68.3s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 68.3s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 4.12s
#155	Kimi K2.5 none	Moonshot AI	1	5.5	$0.127	6/22	19.2s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.127 ردِعمل کا وقت (اوسط) 19.2s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
کل ٹیسٹس 19 غلط ٹیسٹس 13 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 6.73s

1 2 3 4 5

→

کوئی جواب نہیں ناکامیاں

ماڈلز فلٹر کریں

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز