संयुक्त x API त्रुटि रैंकिंग

देखें कि संयुक्त में किन AI मॉडलों में API त्रुटि आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

कुल विफलताएँ

सबसे अधिक प्रभावित मॉडल

Qwen3.6 35B A3B 1

विफलता के कारण

अमान्य टूल कॉल91 गलत उत्तर68 कोई उत्तर नहीं29 API त्रुटि26 समय समाप्त5 अतिरिक्त फॉर्मेटिंग1 निर्देशों का पालन नहीं किया1

श्रेणियाँ

कोडिंग45 संयुक्त26 टूल कॉलिंग17 एंटी-एआई ट्रिक्स14 डेटा पार्सिंग और निष्कर्षण14 सामान्य ज्ञान13 Samanya Buddhimatta12 पहेली समाधान12 डोमेन-विशिष्ट7 निर्देश पालन1

24/24

रैंक	मॉडल	कंपनी	API त्रुटि संख्या	श्रेणी स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#90	Qwen3.6 35B A3B medium	Qwen	1	3.0	$0.746	0/2	817.6s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.746 प्रतिक्रिया समय (औसत) 817.6s
#130	Step 3.5 Flash medium	Stepfun	1	6.5	$0.108	1/2	813.7s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 813.7s
#110	Gemma 4 31B medium	Google	1	2.9	$0.163	0/2	433.1s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 433.1s
#140	Nemotron 3 Super medium	NVIDIA	1	6.4	$0.050	1/2	259.9s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.050 प्रतिक्रिया समय (औसत) 259.9s
#33	Kimi K3 max	Moonshot AI	1	6.5	$3.112	1/2	223.0s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $3.112 प्रतिक्रिया समय (औसत) 223.0s
#60	LongCat 2.0 medium	Meituan	1	7.3	$0.478	1/2	151.0s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.478 प्रतिक्रिया समय (औसत) 151.0s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.4	$0.467	1/2	135.7s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.467 प्रतिक्रिया समय (औसत) 135.7s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	1	6.4	$0.387	1/2	111.9s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.387 प्रतिक्रिया समय (औसत) 111.9s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.5	$0.077	1/2	74.5s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.077 प्रतिक्रिया समय (औसत) 74.5s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	1	3.8	$0.067	0/2	73.0s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.067 प्रतिक्रिया समय (औसत) 73.0s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	1	6.4	$0.041	1/2	55.9s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 55.9s
#161	Qwen3.6 35B A3B none	Qwen	1	3.8	$0.061	0/2	39.5s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.061 प्रतिक्रिया समय (औसत) 39.5s
#115	Gemma 4 31B none	Google	1	3.8	$0.035	0/2	30.0s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.035 प्रतिक्रिया समय (औसत) 30.0s
#129	Nemotron 3 Ultra none	NVIDIA	1	3.0	$0.095	0/2	21.1s
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 21.1s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	6.5	$0.048	1/2	19.6s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 19.6s

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल

संयुक्त: API त्रुटि

मॉडल फ़िल्टर करें

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल