कोई उत्तर नहीं विफलता रैंकिंग

देखें कि किन AI मॉडलों में कोई उत्तर नहीं सबसे अधिक होता है, ताकि आप चुनने से पहले भरोसेमंदी के जोखिम समझ सकें। क्रमबद्ध करें: विफलता संख्या ↑.

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

Claude Opus 4.8 1

श्रेणियाँ

67/67

रैंक	मॉडल	कंपनी	कोई उत्तर नहीं संख्या	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.478 प्रतिक्रिया समय (औसत) 136.6s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
कुल टेस्ट 22 गलत टेस्ट 9 कुल लागत $1.166 प्रतिक्रिया समय (औसत) 4.91s
#67	Step 3.7 Flash low	Stepfun	1	7.3	$0.454	12/22	20.7s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 20.7s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $1.036 प्रतिक्रिया समय (औसत) 110.0s
#73	Grok 4.3 medium	X AI	1	7.1	$0.779	13/22	47.4s
कुल टेस्ट 22 गलत टेस्ट 9 कुल लागत $0.779 प्रतिक्रिया समय (औसत) 47.4s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
कुल टेस्ट 22 गलत टेस्ट 9 कुल लागत $0.535 प्रतिक्रिया समय (औसत) 46.8s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	7.0	$0.101	11/22	92.5s
कुल टेस्ट 22 गलत टेस्ट 11 कुल लागत $0.101 प्रतिक्रिया समय (औसत) 92.5s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
कुल टेस्ट 22 गलत टेस्ट 9 कुल लागत $0.085 प्रतिक्रिया समय (औसत) 2.95s
#90	Qwen3.6 35B A3B medium	Qwen	1	6.7	$0.746	13/22	58.1s
कुल टेस्ट 22 गलत टेस्ट 9 कुल लागत $0.746 प्रतिक्रिया समय (औसत) 58.1s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
कुल टेस्ट 22 गलत टेस्ट 12 कुल लागत $0.391 प्रतिक्रिया समय (औसत) 100.3s
#101	MiMo-V2.5 medium	Xiaomi	1	6.5	$0.082	12/22	32.2s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 32.2s
#102	Laguna XS 2.1 medium	Poolside	1	6.5	$0.068	9/22	47.9s
कुल टेस्ट 22 गलत टेस्ट 13 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 47.9s
#106	Gemini 3.1 Flash Lite Preview none	Google	1	6.4	$0.052	12/22	1.58s
कुल टेस्ट 22 गलत टेस्ट 10 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 1.58s
#110	Gemma 4 31B medium	Google	1	6.3	$0.163	14/22	75.4s
कुल टेस्ट 22 गलत टेस्ट 8 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 75.4s
#116	Seed-2.0-Lite none	Bytedance Seed	1	6.2	$0.066	8/22	4.40s
कुल टेस्ट 22 गलत टेस्ट 14 कुल लागत $0.066 प्रतिक्रिया समय (औसत) 4.40s

←

1 2 3 4 5

→

कोई उत्तर नहीं विफलताएँ

मॉडल फ़िल्टर करें

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल