Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Qwen3.5-35B-A3B 2.8

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ62 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

216/216

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#102	LongCat 2.0 high	Meituan	5.1	6.6	$0.469	0/1	17.0s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.469 प्रतिक्रिया समय (औसत) 17.0s
#143	North Mini Code medium	Cohere	5.1	5.9	$0.000	0/1	25.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 25.1s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	5.1	5.6	$0.077	0/1	7.10s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.077 प्रतिक्रिया समय (औसत) 7.10s
#51	MiniMax M3 medium	Minimax	5.1	7.6	$0.286	0/1	33.3s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.286 प्रतिक्रिया समय (औसत) 33.3s
#84	Seed-2.0-Mini medium	Bytedance Seed	5.1	7.0	$0.101	0/1	36.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.101 प्रतिक्रिया समय (औसत) 36.7s
#158	Qwen3.6 27B none	Qwen	5.2	5.5	$0.087	0/1	1.07s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 1.07s
#75	Qwen3.7 Plus none	Qwen	5.3	7.2	$0.106	0/1	1.33s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 1.33s
#144	Kimi K2.6 none	Moonshot AI	5.4	5.8	$0.184	0/1	1.55s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.184 प्रतिक्रिया समय (औसत) 1.55s
#31	Gemini 3.5 Flash-Lite high	Google	5.4	8.1	$0.584	0/1	3.40s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.584 प्रतिक्रिया समय (औसत) 3.40s
#77	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.779 प्रतिक्रिया समय (औसत) 24.7s
#104	Gemini 3.5 Flash-Lite medium	Google	5.4	6.5	$0.369	0/1	2.93s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.369 प्रतिक्रिया समय (औसत) 2.93s
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 5.37s
#140	Mimo V2 Omni medium	Xiaomi	5.4	5.9	$0.683	0/1	3.61s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 3.61s
#43	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 2.37s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.5	6.9	$0.187	0/1	4.02s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 4.02s

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल