Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Qwen3.5-9B 2.8

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ62 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

216/216

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#196	MiniMax M2.5 medium	Minimax	3.8	4.6	$0.340	0/1	6.63s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.340 प्रतिक्रिया समय (औसत) 6.63s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	1/1	6.53s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.006 प्रतिक्रिया समय (औसत) 6.53s
#190	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 6.44s
#187	Grok 4.20 Multi Agent Beta medium	X AI	5.8	4.8	$5.599	0/1	6.40s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 6.40s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	1/1	5.78s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 5.78s
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 5.37s
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	1/1	5.25s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $2.310 प्रतिक्रिया समय (औसत) 5.25s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	1/1	5.19s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.742 प्रतिक्रिया समय (औसत) 5.19s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	1/1	5.17s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $1.253 प्रतिक्रिया समय (औसत) 5.17s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	4.8	6.7	$0.476	0/1	5.16s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.476 प्रतिक्रिया समय (औसत) 5.16s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	1/1	5.04s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $3.059 प्रतिक्रिया समय (औसत) 5.04s
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	1/1	4.94s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $2.057 प्रतिक्रिया समय (औसत) 4.94s
#115	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	1/1	4.92s
कुल टेस्ट 1 गलत टेस्ट 0 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 4.92s
#21	GPT-5.4 medium	OpenAI	4.7	8.5	$1.533	0/1	4.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.533 प्रतिक्रिया समय (औसत) 4.92s
#23	Grok 4.5 low	X AI	6.1	8.4	$0.935	0/1	4.88s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.935 प्रतिक्रिया समय (औसत) 4.88s

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल