Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ62 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

216/216

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#101	GLM 5.2 none	Z.ai	6.1	6.6	$0.128	0/1	4.42s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.128 प्रतिक्रिया समय (औसत) 4.42s
#120	Qwen3.5-Flash medium	Qwen	6.1	6.2	$0.139	0/1	40.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.139 प्रतिक्रिया समय (औसत) 40.1s
#202	Hunter Alpha none	OpenRouter	6.1	4.2	$0.000	0/1	2.71s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.71s
#187	Grok 4.20 Multi Agent Beta medium	X AI	5.8	4.8	$5.599	0/1	6.40s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 6.40s
#43	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 2.37s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.5	6.9	$0.187	0/1	4.02s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 4.02s
#90	Step 3.7 Flash high	Stepfun	5.5	6.9	$1.207	0/1	4.17s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.207 प्रतिक्रिया समय (औसत) 4.17s
#136	Step 3.5 Flash medium	Stepfun	5.5	6.0	$0.108	0/1	22.4s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 22.4s
#31	Gemini 3.5 Flash-Lite high	Google	5.4	8.1	$0.584	0/1	3.40s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.584 प्रतिक्रिया समय (औसत) 3.40s
#77	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.779 प्रतिक्रिया समय (औसत) 24.7s
#104	Gemini 3.5 Flash-Lite medium	Google	5.4	6.5	$0.369	0/1	2.93s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.369 प्रतिक्रिया समय (औसत) 2.93s
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 5.37s
#140	Mimo V2 Omni medium	Xiaomi	5.4	5.9	$0.683	0/1	3.61s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 3.61s
#144	Kimi K2.6 none	Moonshot AI	5.4	5.8	$0.184	0/1	1.55s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.184 प्रतिक्रिया समय (औसत) 1.55s
#75	Qwen3.7 Plus none	Qwen	5.3	7.2	$0.106	0/1	1.33s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 1.33s

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल