کوئی جواب نہیں ناکامی درجہ بندی

دیکھیں کہ کن AI ماڈلز میں کوئی جواب نہیں سب سے زیادہ ہوتا ہے، تاکہ آپ انتخاب سے پہلے قابلِ اعتماد ہونے کے خطرات سمجھ سکیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

کل ناکامیاں

سب سے زیادہ متاثر ماڈل

Gemini 3.1 Flash Lite Preview 1

زمرے

زمرہ مشترکہ میں29 زمرہ کوڈنگ میں18 زمرہ معلومات عامہ میں13 زمرہ ڈومین مخصوص میں8 زمرہ ڈیٹا پارسنگ اور استخراج میں8 زمرہ اینٹی اے آئی چالیں میں4 زمرہ پہیلی حل کرنا میں3 زمرہ ٹول کالنگ میں2 زمرہ ہدایات کی پیروی میں2

67/67

درجہ	ماڈل	کمپنی	کوئی جواب نہیں کی تعداد	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#106	Gemini 3.1 Flash Lite Preview none	Google	1	6.4	$0.052	12/22	1.58s
کل ٹیسٹس 22 غلط ٹیسٹس 10 کل لاگت $0.052 ردِعمل کا وقت (اوسط) 1.58s
#132	GPT-5.6 Terra none	OpenAI	1	6.0	$0.349	8/22	1.65s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.349 ردِعمل کا وقت (اوسط) 1.65s
#122	Gemini 3.1 Flash Lite none	Google	1	6.1	$0.046	9/22	1.75s
کل ٹیسٹس 22 غلط ٹیسٹس 13 کل لاگت $0.046 ردِعمل کا وقت (اوسط) 1.75s
#120	Gemini 3.1 Flash Lite minimal	Google	1	6.1	$0.047	10/22	1.86s
کل ٹیسٹس 22 غلط ٹیسٹس 12 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 1.86s
#174	GPT-4o-mini none	OpenAI	1	5.0	$0.010	5/22	1.99s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 1.99s
#180	GPT-5.4 Nano none	OpenAI	1	4.8	$0.041	4/22	2.57s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 2.57s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $0.085 ردِعمل کا وقت (اوسط) 2.95s
#154	MiMo-V2.5-Pro none	Xiaomi	1	5.5	$0.068	6/22	4.12s
کل ٹیسٹس 22 غلط ٹیسٹس 16 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 4.12s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.066 ردِعمل کا وقت (اوسط) 4.40s
#168	MiMo-V2.5 none	Xiaomi	1	5.1	$0.025	5/22	4.62s
کل ٹیسٹس 22 غلط ٹیسٹس 17 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 4.62s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
کل ٹیسٹس 22 غلط ٹیسٹس 9 کل لاگت $1.166 ردِعمل کا وقت (اوسط) 4.91s
#161	Qwen3.6 35B A3B none	Qwen	1	5.3	$0.061	4/22	5.52s
کل ٹیسٹس 22 غلط ٹیسٹس 18 کل لاگت $0.061 ردِعمل کا وقت (اوسط) 5.52s
#112	Claude Sonnet 5 none	Anthropic	2	6.3	$0.548	8/22	6.04s
کل ٹیسٹس 22 غلط ٹیسٹس 14 کل لاگت $0.548 ردِعمل کا وقت (اوسط) 6.04s
#151	GLM 5.1 none	Z.ai	1	5.5	$0.164	7/22	6.70s
کل ٹیسٹس 22 غلط ٹیسٹس 15 کل لاگت $0.164 ردِعمل کا وقت (اوسط) 6.70s
#198	Laguna Xs.2 medium	Poolside	2	4.1	$0.015	6/19	6.73s
کل ٹیسٹس 19 غلط ٹیسٹس 13 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 6.73s

1 2 3 4 5

→

کوئی جواب نہیں ناکامیاں

ماڈلز فلٹر کریں

کوئی جواب نہیں کی تعداد کے لحاظ سے سرفہرست ماڈلز

کوئی جواب نہیں کی تعداد بمقابلہ اسکور

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز