Samanya Buddhimatta मॉडेल क्रमवारी

Samanya Buddhimatta मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी Samanya Buddhimatta स्कोअर

6.1

सर्वोत्तम मॉडेल

Qwen3.5-35B-A3B 2.8

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह78 अयशस्वी होण्याचे कारण चुकीचे उत्तर सह59 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण वेळ संपला सह4

210/210

क्रमांक	मॉडेल	कंपनी	Samanya Buddhimatta स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#119	Qwen3.5-35B-A3B medium	Qwen	2.8	6.2	$0.837	0/1	30.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.837 प्रतिसाद वेळ (सरासरी) 30.3s
#204	Qwen3.5-9B medium	Qwen	2.8	3.8	$0.036	0/1	226.4s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 226.4s
#135	Hy3 preview high	Tencent	3.0	5.9	$0.048	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.048 प्रतिसाद वेळ (सरासरी) 0ms
#153	Hy3 preview low	Tencent	3.0	5.5	$0.015	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.015 प्रतिसाद वेळ (सरासरी) 0ms
#175	Qwen3.6 Plus Preview medium	Qwen	3.0	4.9	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#186	Laguna M.1 medium	Poolside	3.0	4.7	$0.033	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 0ms
#192	Laguna M.1 none	Poolside	3.0	4.4	$0.009	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 0ms
#198	Laguna Xs.2 medium	Poolside	3.0	4.1	$0.015	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.015 प्रतिसाद वेळ (सरासरी) 0ms
#205	Laguna Xs.2 none	Poolside	3.0	3.8	$0.004	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.4	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.2	$0.000	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 0ms
#76	DeepSeek V3.2 medium	DeepSeek	3.4	7.0	$0.078	0/1	58.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.078 प्रतिसाद वेळ (सरासरी) 58.3s
#72	Qwen3.5-122B-A10B medium	Qwen	3.4	7.1	$1.046	0/1	34.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.046 प्रतिसाद वेळ (सरासरी) 34.1s
#91	LongCat 2.0 low	Meituan	3.4	6.7	$0.391	0/1	22.5s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 22.5s
#67	Step 3.7 Flash low	Stepfun	3.4	7.3	$0.454	0/1	7.00s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.454 प्रतिसाद वेळ (सरासरी) 7.00s

1 2 14

→

Samanya Buddhimatta क्रमवारी

मॉडेल फिल्टर करा

Samanya Buddhimatta स्कोअर नुसार शीर्ष मॉडेल्स

Samanya Buddhimatta स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स