Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ62 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

216/216

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#15	Grok 4.5 high	X AI	4.7	8.9	$1.707	0/1	9.82s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.707 प्रतिक्रिया समय (औसत) 9.82s
#16	GPT-5.3-Codex medium	OpenAI	4.6	8.9	$0.920	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 4.87s
#21	GPT-5.4 medium	OpenAI	4.7	8.5	$1.533	0/1	4.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.533 प्रतिक्रिया समय (औसत) 4.92s
#23	Grok 4.5 low	X AI	6.1	8.4	$0.935	0/1	4.88s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.935 प्रतिक्रिया समय (औसत) 4.88s
#24	GPT-5.2 medium	OpenAI	3.7	8.4	$0.951	0/1	4.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 4.32s
#25	Grok 4.5 medium	X AI	6.5	8.3	$1.928	0/1	12.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.928 प्रतिक्रिया समय (औसत) 12.8s
#26	Claude Sonnet 5 medium	Anthropic	4.8	8.3	$0.922	0/1	4.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.922 प्रतिक्रिया समय (औसत) 4.32s
#28	Gemini 2.5 Flash medium	Google	4.8	8.2	$0.643	0/1	4.86s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.643 प्रतिक्रिया समय (औसत) 4.86s
#29	GPT-5 Mini medium	OpenAI	4.5	8.1	$0.237	0/1	13.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 13.5s
#31	Gemini 3.5 Flash-Lite high	Google	5.4	8.1	$0.584	0/1	3.40s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.584 प्रतिक्रिया समय (औसत) 3.40s
#33	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 6.85s
#34	GPT-5.2 Chat none	OpenAI	4.4	8.0	$0.604	0/1	3.20s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 3.20s
#38	GPT-5.6 Terra high	OpenAI	5.1	8.0	$1.055	0/1	3.03s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.055 प्रतिक्रिया समय (औसत) 3.03s
#39	Seed-2.0-Lite medium	Bytedance Seed	6.7	7.9	$0.234	0/1	18.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 18.2s
#41	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.405 प्रतिक्रिया समय (औसत) 27.1s

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल