Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Qwen3.5-35B-A3B 2.8

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ62 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

216/216

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#148	Qwen3.5-122B-A10B none	Qwen	5.0	5.7	$0.247	0/1	1.12s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.247 प्रतिक्रिया समय (औसत) 1.12s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	5.0	5.6	$0.048	0/1	9.81s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 9.81s
#157	GLM 5.1 none	Z.ai	5.0	5.5	$0.164	0/1	790ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.164 प्रतिक्रिया समय (औसत) 790ms
#164	KAT-Coder-Air V2.5 low	Kwaipilot	5.0	5.4	$0.041	0/1	10.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 10.1s
#165	GPT-5.6 Luna none	OpenAI	5.0	5.4	$0.142	0/1	1.00s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.142 प्रतिक्रिया समय (औसत) 1.00s
#166	Laguna XS 2.1 none	Poolside	5.0	5.3	$0.008	0/1	529ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 529ms
#168	Ling-2.6-1T none	Inclusionai	5.0	5.3	$0.016	0/1	20.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 20.3s
#170	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.147 प्रतिक्रिया समय (औसत) 859ms
#188	KAT-Coder-Air V2.5 none	Kwaipilot	5.0	4.8	$0.067	0/1	12.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.067 प्रतिक्रिया समय (औसत) 12.0s
#197	Grok 4.20 Beta none	X AI	5.0	4.4	$0.087	0/1	541ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 541ms
#149	Gemini 3.1 Flash Lite high	Google	5.0	5.6	$2.044	0/1	45.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 45.7s
#38	GPT-5.6 Terra high	OpenAI	5.1	8.0	$1.055	0/1	3.03s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.055 प्रतिक्रिया समय (औसत) 3.03s
#41	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.405 प्रतिक्रिया समय (औसत) 27.1s
#54	GPT-5.6 Luna medium	OpenAI	5.1	7.6	$0.352	0/1	4.34s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.352 प्रतिक्रिया समय (औसत) 4.34s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	5.1	7.2	$0.482	0/1	3.27s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.482 प्रतिक्रिया समय (औसत) 3.27s

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल