कोडी सोडवणे मॉडेल क्रमवारी

कोडी सोडवणे मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी कोडी सोडवणे स्कोअर

6.7

सर्वोत्तम मॉडेल

GPT-5.4 Nano 4.1

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह201 अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह90 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह8 अयशस्वी होण्याचे कारण वेळ संपला सह5 अयशस्वी होण्याचे कारण उत्तर नाही सह3

210/210

क्रमांक	मॉडेल	कंपनी	कोडी सोडवणे स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#53	GPT-5.4 Nano medium	OpenAI	4.1	7.5	$0.138	0/3	3.79s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.138 प्रतिसाद वेळ (सरासरी) 3.79s
#91	LongCat 2.0 low	Meituan	3.1	6.7	$0.391	0/3	8.15s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 8.15s
#97	LongCat 2.0 high	Meituan	3.1	6.6	$0.469	0/3	9.18s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.469 प्रतिसाद वेळ (सरासरी) 9.18s
#111	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.044 प्रतिसाद वेळ (सरासरी) 2.74s
#124	Qwen3.6 Flash none	Qwen	3.5	6.1	$0.062	0/3	1.21s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.062 प्रतिसाद वेळ (सरासरी) 1.21s
#125	Qwen3.5-Flash none	Qwen	3.1	6.1	$0.073	0/3	10.9s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.073 प्रतिसाद वेळ (सरासरी) 10.9s
#127	Qwen3.5-35B-A3B none	Qwen	3.7	6.1	$0.106	0/3	1.35s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.106 प्रतिसाद वेळ (सरासरी) 1.35s
#137	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 19.7s
#138	Kimi K2.6 none	Moonshot AI	3.1	5.8	$0.184	0/3	1.40s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.184 प्रतिसाद वेळ (सरासरी) 1.40s
#140	Nemotron 3 Super medium	NVIDIA	3.0	5.7	$0.050	0/3	3.15s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.050 प्रतिसाद वेळ (सरासरी) 3.15s
#142	Qwen3.5-122B-A10B none	Qwen	3.8	5.7	$0.247	0/3	1.00s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.247 प्रतिसाद वेळ (सरासरी) 1.00s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	3.5	5.6	$0.077	0/3	2.47s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.077 प्रतिसाद वेळ (सरासरी) 2.47s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	3.6	5.6	$0.048	0/3	1.87s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.048 प्रतिसाद वेळ (सरासरी) 1.87s
#150	DeepSeek V4 Flash none	DeepSeek	3.1	5.6	$0.044	0/3	23.7s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.044 प्रतिसाद वेळ (सरासरी) 23.7s
#155	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.127	0/3	4.04s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.127 प्रतिसाद वेळ (सरासरी) 4.04s

1 2 14

→

कोडी सोडवणे क्रमवारी

मॉडेल फिल्टर करा

कोडी सोडवणे स्कोअर नुसार शीर्ष मॉडेल्स

कोडी सोडवणे स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स