पहेली समाधान x API त्रुटि रैंकिंग

देखें कि पहेली समाधान में किन AI मॉडलों में API त्रुटि आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

Laguna M.1 1

विफलता के कारण

गलत उत्तर201 निर्देशों का पालन नहीं किया90 API त्रुटि12 अतिरिक्त फॉर्मेटिंग8 समय समाप्त5 कोई उत्तर नहीं3

श्रेणियाँ

कोडिंग45 संयुक्त26 टूल कॉलिंग17 एंटी-एआई ट्रिक्स14 डेटा पार्सिंग और निष्कर्षण14 सामान्य ज्ञान13 Samanya Buddhimatta12 पहेली समाधान12 डोमेन-विशिष्ट7 निर्देश पालन1

11/11

रैंक	मॉडल	कंपनी	API त्रुटि संख्या	श्रेणी स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/3	891ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 891ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	2.9	$0.000	0/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 1.40s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/3	532ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 532ms
#210	LFM2-24B-A2B none	Liquid	1	3.8	$0.001	0/3	1.78s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.001 प्रतिक्रिया समय (औसत) 1.78s
#153	Hy3 preview low	Tencent	1	5.3	$0.015	1/3	7.51s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 7.51s
#175	Qwen3.6 Plus Preview medium	Qwen	2	5.3	$0.000	1/3	7.52s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 7.52s
#186	Laguna M.1 medium	Poolside	1	5.3	$0.033	1/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 10.2s
#198	Laguna Xs.2 medium	Poolside	1	5.3	$0.015	1/3	1.93s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 1.93s
#205	Laguna Xs.2 none	Poolside	1	5.3	$0.004	1/3	650ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.004 प्रतिक्रिया समय (औसत) 650ms
#135	Hy3 preview high	Tencent	1	7.7	$0.048	2/3	27.9s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 27.9s
#173	DeepSeek V3.2 none	DeepSeek	1	7.6	$0.054	2/3	6.91s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 6.91s

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल

पहेली समाधान: API त्रुटि

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल