कोडी सोडवणे मॉडेल क्रमवारी

कोडी सोडवणे मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी कोडी सोडवणे स्कोअर

6.7

सर्वोत्तम मॉडेल

GPT-5.4 Nano 4.1

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह204 अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह90 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह8 अयशस्वी होण्याचे कारण वेळ संपला सह5 अयशस्वी होण्याचे कारण उत्तर नाही सह3

216/216

क्रमांक	मॉडेल	कंपनी	कोडी सोडवणे स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#195	Mercury 2 none	Inception	3.1	4.6	$0.030	0/3	535ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.030 प्रतिसाद वेळ (सरासरी) 535ms
#198	Laguna M.1 none	Poolside	3.0	4.4	$0.009	0/3	891ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 891ms
#199	Elephant Alpha none	Openrouter	4.2	4.3	$0.000	0/3	807ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 807ms
#200	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/3	12.9s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.166 प्रतिसाद वेळ (सरासरी) 12.9s
#205	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.003 प्रतिसाद वेळ (सरासरी) 4.56s
#207	Granite 4.1 8B none	IBM Granite	3.2	4.0	$0.007	0/3	608ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 608ms
#209	Grok 4.1 Fast none	X AI	3.0	3.8	$0.008	0/3	1.10s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 1.10s
#210	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/3	32.3s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 32.3s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	1.40s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 1.40s
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.2	$0.000	0/3	532ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 532ms
#215	Step 3.5 Flash none	Stepfun	0.0	2.3	$0.020	0/0	0ms
एकूण चाचण्या 0 चुकीच्या चाचण्या 0 एकूण खर्च $0.020 प्रतिसाद वेळ (सरासरी) 0ms
#216	LFM2-24B-A2B none	Liquid	3.8	2.2	$0.001	0/3	1.78s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.001 प्रतिसाद वेळ (सरासरी) 1.78s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
एकूण चाचण्या 3 चुकीच्या चाचण्या 2 एकूण खर्च $0.237 प्रतिसाद वेळ (सरासरी) 15.2s
#32	Inkling high	Thinkingmachines	6.9	8.0	$1.006	1/3	10.7s
एकूण चाचण्या 3 चुकीच्या चाचण्या 2 एकूण खर्च $1.006 प्रतिसाद वेळ (सरासरी) 10.7s
#33	Step 3.7 Flash medium	Stepfun	5.7	8.0	$0.515	1/3	6.19s
एकूण चाचण्या 3 चुकीच्या चाचण्या 2 एकूण खर्च $0.515 प्रतिसाद वेळ (सरासरी) 6.19s

कोडी सोडवणे क्रमवारी

मॉडेल फिल्टर करा

कोडी सोडवणे स्कोअर नुसार शीर्ष मॉडेल्स

कोडी सोडवणे स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स