Samanya Buddhimatta x API त्रुटि रैंकिंग

देखें कि Samanya Buddhimatta में किन AI मॉडलों में API त्रुटि आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

Nemotron 3 Ultra 1

विफलता के कारण

निर्देशों का पालन नहीं किया78 गलत उत्तर62 API त्रुटि12 समय समाप्त4

श्रेणियाँ

कोडिंग45 संयुक्त26 टूल कॉलिंग17 एंटी-एआई ट्रिक्स14 डेटा पार्सिंग और निष्कर्षण14 सामान्य ज्ञान13 Samanya Buddhimatta12 पहेली समाधान12 डोमेन-विशिष्ट7 निर्देश पालन1

12/12

रैंक	मॉडल	कंपनी	API त्रुटि संख्या	श्रेणी स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#55	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.774 प्रतिक्रिया समय (औसत) 2.52s
#80	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.078 प्रतिक्रिया समय (औसत) 58.3s
#141	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 0ms
#159	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 0ms
#179	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.054 प्रतिक्रिया समय (औसत) 9.32s
#181	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#192	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 0ms
#198	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 0ms
#204	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 0ms
#211	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.004 प्रतिक्रिया समय (औसत) 0ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 0ms

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल

Samanya Buddhimatta: API त्रुटि

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल