कोडी सोडवणे मॉडेल क्रमवारी

कोडी सोडवणे मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी कोडी सोडवणे स्कोअर

6.7

सर्वोत्तम मॉडेल

Step 3.5 Flash 0.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह201 अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह90 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह8 अयशस्वी होण्याचे कारण वेळ संपला सह5 अयशस्वी होण्याचे कारण उत्तर नाही सह3

210/210

क्रमांक	मॉडेल	कंपनी	कोडी सोडवणे स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#158	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 1.57s
#91	LongCat 2.0 low	Meituan	3.1	6.7	$0.391	0/3	8.15s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 8.15s
#125	Qwen3.5-Flash none	Qwen	3.1	6.1	$0.073	0/3	10.9s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.073 प्रतिसाद वेळ (सरासरी) 10.9s
#162	Ling-2.6-1T none	Inclusionai	3.1	5.3	$0.016	0/3	5.36s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.016 प्रतिसाद वेळ (सरासरी) 5.36s
#189	Mercury 2 none	Inception	3.1	4.6	$0.030	0/3	535ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.030 प्रतिसाद वेळ (सरासरी) 535ms
#199	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.003 प्रतिसाद वेळ (सरासरी) 4.56s
#138	Kimi K2.6 none	Moonshot AI	3.1	5.8	$0.184	0/3	1.40s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.184 प्रतिसाद वेळ (सरासरी) 1.40s
#165	Mistral Small 4 none	Mistral	3.1	5.1	$0.022	0/3	399ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.022 प्रतिसाद वेळ (सरासरी) 399ms
#97	LongCat 2.0 high	Meituan	3.1	6.6	$0.469	0/3	9.18s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.469 प्रतिसाद वेळ (सरासरी) 9.18s
#169	Qwen3.5-9B none	Qwen	3.2	5.1	$0.021	0/3	621ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.021 प्रतिसाद वेळ (सरासरी) 621ms
#201	Granite 4.1 8B none	IBM Granite	3.2	4.0	$0.007	0/3	608ms
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 608ms
#161	Qwen3.6 35B A3B none	Qwen	3.2	5.3	$0.061	0/3	1.07s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.061 प्रतिसाद वेळ (सरासरी) 1.07s
#137	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 19.7s
#167	Mistral Small 4 medium	Mistral	3.4	5.1	$0.096	0/3	2.17s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.096 प्रतिसाद वेळ (सरासरी) 2.17s
#124	Qwen3.6 Flash none	Qwen	3.5	6.1	$0.062	0/3	1.21s
एकूण चाचण्या 3 चुकीच्या चाचण्या 3 एकूण खर्च $0.062 प्रतिसाद वेळ (सरासरी) 1.21s

कोडी सोडवणे क्रमवारी

मॉडेल फिल्टर करा

कोडी सोडवणे स्कोअर नुसार शीर्ष मॉडेल्स

कोडी सोडवणे स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स