Samanya Buddhimatta मॉडेल क्रमवारी

Samanya Buddhimatta मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी Samanya Buddhimatta स्कोअर

6.1

सर्वोत्तम मॉडेल

Qwen3.5-35B-A3B 2.8

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह78 अयशस्वी होण्याचे कारण चुकीचे उत्तर सह62 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण वेळ संपला सह4

216/216

क्रमांक	मॉडेल	कंपनी	Samanya Buddhimatta स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#148	Qwen3.5-122B-A10B none	Qwen	5.0	5.7	$0.247	0/1	1.12s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.247 प्रतिसाद वेळ (सरासरी) 1.12s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	5.0	5.6	$0.048	0/1	9.81s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.048 प्रतिसाद वेळ (सरासरी) 9.81s
#157	GLM 5.1 none	Z.ai	5.0	5.5	$0.164	0/1	790ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.164 प्रतिसाद वेळ (सरासरी) 790ms
#164	KAT-Coder-Air V2.5 low	Kwaipilot	5.0	5.4	$0.041	0/1	10.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 10.1s
#165	GPT-5.6 Luna none	OpenAI	5.0	5.4	$0.142	0/1	1.00s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.142 प्रतिसाद वेळ (सरासरी) 1.00s
#166	Laguna XS 2.1 none	Poolside	5.0	5.3	$0.008	0/1	529ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 529ms
#168	Ling-2.6-1T none	Inclusionai	5.0	5.3	$0.016	0/1	20.3s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.016 प्रतिसाद वेळ (सरासरी) 20.3s
#170	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.147 प्रतिसाद वेळ (सरासरी) 859ms
#188	KAT-Coder-Air V2.5 none	Kwaipilot	5.0	4.8	$0.067	0/1	12.0s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.067 प्रतिसाद वेळ (सरासरी) 12.0s
#197	Grok 4.20 Beta none	X AI	5.0	4.4	$0.087	0/1	541ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 541ms
#149	Gemini 3.1 Flash Lite high	Google	5.0	5.6	$2.044	0/1	45.7s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $2.044 प्रतिसाद वेळ (सरासरी) 45.7s
#38	GPT-5.6 Terra high	OpenAI	5.1	8.0	$1.055	0/1	3.03s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $1.055 प्रतिसाद वेळ (सरासरी) 3.03s
#41	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.405 प्रतिसाद वेळ (सरासरी) 27.1s
#54	GPT-5.6 Luna medium	OpenAI	5.1	7.6	$0.352	0/1	4.34s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.352 प्रतिसाद वेळ (सरासरी) 4.34s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	5.1	7.2	$0.482	0/1	3.27s
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.482 प्रतिसाद वेळ (सरासरी) 3.27s

Samanya Buddhimatta क्रमवारी

मॉडेल फिल्टर करा

Samanya Buddhimatta स्कोअर नुसार शीर्ष मॉडेल्स

Samanya Buddhimatta स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स