Samanya Buddhimatta मॉडल रैंकिंग

देखें कि Samanya Buddhimatta में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत Samanya Buddhimatta स्कोर

6.1

सर्वश्रेष्ठ मॉडल

Grok 4.5 4.7

विफलता के कारण

विफलता कारण निर्देशों का पालन नहीं किया के साथ78 विफलता कारण गलत उत्तर के साथ59 विफलता कारण API त्रुटि के साथ12 विफलता कारण समय समाप्त के साथ4

210/210

रैंक	मॉडल	कंपनी	Samanya Buddhimatta स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#12	Grok 4.5 high	X AI	4.7	8.9	$1.707	0/1	9.82s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.707 प्रतिक्रिया समय (औसत) 9.82s
#13	GPT-5.3-Codex medium	OpenAI	4.6	8.9	$0.920	0/1	4.87s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 4.87s
#18	GPT-5.4 medium	OpenAI	4.7	8.5	$1.533	0/1	4.92s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.533 प्रतिक्रिया समय (औसत) 4.92s
#20	Grok 4.5 low	X AI	6.1	8.4	$0.935	0/1	4.88s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.935 प्रतिक्रिया समय (औसत) 4.88s
#21	GPT-5.2 medium	OpenAI	3.7	8.4	$0.951	0/1	4.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 4.32s
#22	Grok 4.5 medium	X AI	6.5	8.3	$1.928	0/1	12.8s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.928 प्रतिक्रिया समय (औसत) 12.8s
#23	Claude Sonnet 5 medium	Anthropic	4.8	8.3	$0.922	0/1	4.32s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.922 प्रतिक्रिया समय (औसत) 4.32s
#25	Gemini 2.5 Flash medium	Google	4.8	8.2	$0.643	0/1	4.86s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.643 प्रतिक्रिया समय (औसत) 4.86s
#26	GPT-5 Mini medium	OpenAI	4.5	8.1	$0.237	0/1	13.5s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 13.5s
#29	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 6.85s
#30	GPT-5.2 Chat none	OpenAI	4.4	8.0	$0.604	0/1	3.20s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 3.20s
#34	GPT-5.6 Terra high	OpenAI	5.1	8.0	$1.055	0/1	3.03s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $1.055 प्रतिक्रिया समय (औसत) 3.03s
#35	Seed-2.0-Lite medium	Bytedance Seed	6.7	7.9	$0.234	0/1	18.2s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 18.2s
#37	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.405 प्रतिक्रिया समय (औसत) 27.1s
#39	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 2.37s

1 2 14

→

Samanya Buddhimatta रैंकिंग

मॉडल फ़िल्टर करें

Samanya Buddhimatta स्कोर के अनुसार शीर्ष मॉडल

Samanya Buddhimatta स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल