Samanya Buddhimatta मॉडेल क्रमवारी

Samanya Buddhimatta मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी Samanya Buddhimatta स्कोअर

6.1

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह78 अयशस्वी होण्याचे कारण चुकीचे उत्तर सह62 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण वेळ संपला सह4

216/216

क्रमांक	मॉडेल	कंपनी	Samanya Buddhimatta स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#101	GLM 5.2 none	Z.ai	6.1	6.6	$0.128	0/1	4.42s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.128 प्रतिसाद वेळ (सरासरी) 4.42s
#120	Qwen3.5-Flash medium	Qwen	6.1	6.2	$0.139	0/1	40.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.139 प्रतिसाद वेळ (सरासरी) 40.1s
#202	Hunter Alpha none	OpenRouter	6.1	4.2	$0.000	0/1	2.71s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 2.71s
#187	Grok 4.20 Multi Agent Beta medium	X AI	5.8	4.8	$5.599	0/1	6.40s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $5.599 प्रतिसाद वेळ (सरासरी) 6.40s
#43	GPT-5.6 Terra medium	OpenAI	5.5	7.8	$0.676	0/1	2.37s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.676 प्रतिसाद वेळ (सरासरी) 2.37s
#88	MiMo-V2.5-Pro medium	Xiaomi	5.5	6.9	$0.187	0/1	4.02s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.187 प्रतिसाद वेळ (सरासरी) 4.02s
#90	Step 3.7 Flash high	Stepfun	5.5	6.9	$1.207	0/1	4.17s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.207 प्रतिसाद वेळ (सरासरी) 4.17s
#136	Step 3.5 Flash medium	Stepfun	5.5	6.0	$0.108	0/1	22.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.108 प्रतिसाद वेळ (सरासरी) 22.4s
#31	Gemini 3.5 Flash-Lite high	Google	5.4	8.1	$0.584	0/1	3.40s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.584 प्रतिसाद वेळ (सरासरी) 3.40s
#77	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 24.7s
#104	Gemini 3.5 Flash-Lite medium	Google	5.4	6.5	$0.369	0/1	2.93s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.369 प्रतिसाद वेळ (सरासरी) 2.93s
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.082 प्रतिसाद वेळ (सरासरी) 5.37s
#140	Mimo V2 Omni medium	Xiaomi	5.4	5.9	$0.683	0/1	3.61s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.683 प्रतिसाद वेळ (सरासरी) 3.61s
#144	Kimi K2.6 none	Moonshot AI	5.4	5.8	$0.184	0/1	1.55s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.184 प्रतिसाद वेळ (सरासरी) 1.55s
#75	Qwen3.7 Plus none	Qwen	5.3	7.2	$0.106	0/1	1.33s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.106 प्रतिसाद वेळ (सरासरी) 1.33s

Samanya Buddhimatta क्रमवारी

मॉडेल फिल्टर करा

Samanya Buddhimatta स्कोअर नुसार शीर्ष मॉडेल्स

Samanya Buddhimatta स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स