कोई उत्तर नहीं विफलता रैंकिंग

देखें कि किन AI मॉडलों में कोई उत्तर नहीं सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें।

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

श्रेणियाँ

67/67

रैंक	मॉडल	कंपनी	कोई उत्तर नहीं संख्या	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
कुल टेस्ट 22 गलत टेस्ट 19 कुल लागत $0.036 प्रतिक्रिया समय (औसत) 82.2s
#14	Claude Opus 4.8 medium	Anthropic	1	8.8	$1.931	18/22	12.5s
कुल टेस्ट 22 गलत टेस्ट 4 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 12.5s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 22.6s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 27.6s
#27	Muse Spark 1.1 high	Meta	1	8.1	$1.694	12/22	31.5s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $1.694 प्रतिक्रिया समय (औसत) 31.5s
#29	Step 3.7 Flash medium	Stepfun	1	8.0	$0.515	14/22	26.4s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 26.4s
#30	GPT-5.2 Chat none	OpenAI	1	8.0	$0.604	14/22	7.65s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 7.65s
#31	GLM 5.2 high	Z.ai	1	8.0	$0.970	14/22	62.7s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.970 प्रतिक्रिया समय (औसत) 62.7s
#32	Inkling medium	Thinkingmachines	1	8.0	$0.391	15/22	16.2s
कुल टेस्ट 22 गलत टेस्ट 7 कुल लागत $0.391 प्रतिक्रिया समय (औसत) 16.2s
#33	Kimi K3 max	Moonshot AI	1	8.0	$3.112	16/22	122.5s
कुल टेस्ट 22 गलत टेस्ट 6 कुल लागत $3.112 प्रतिक्रिया समय (औसत) 122.5s
#35	Seed-2.0-Lite medium	Bytedance Seed	1	7.9	$0.234	14/22	48.5s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 48.5s
#41	Claude Opus 4.8 low	Anthropic	1	7.8	$2.077	16/22	12.7s
कुल टेस्ट 22 गलत टेस्ट 6 कुल लागत $2.077 प्रतिक्रिया समय (औसत) 12.7s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
कुल टेस्ट 21 गलत टेस्ट 6 कुल लागत $0.307 प्रतिक्रिया समय (औसत) 33.5s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
कुल टेस्ट 22 गलत टेस्ट 12 कुल लागत $0.200 प्रतिक्रिया समय (औसत) 79.1s
#47	MiniMax M3 medium	Minimax	1	7.6	$0.286	12/22	75.0s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.286 प्रतिक्रिया समय (औसत) 75.0s

←

1 2 3 4 5

→

कोई उत्तर नहीं विफलताएँ

मॉडल फ़िल्टर करें

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल