कोडी सोडवणे मॉडेल क्रमवारी

कोडी सोडवणे मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी कोडी सोडवणे स्कोअर

6.7

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह204 अयशस्वी होण्याचे कारण सूचनांचे पालन केले नाही सह90 अयशस्वी होण्याचे कारण API त्रुटी सह12 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह8 अयशस्वी होण्याचे कारण वेळ संपला सह5 अयशस्वी होण्याचे कारण उत्तर नाही सह3

216/216

क्रमांक	मॉडेल	कंपनी	कोडी सोडवणे स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#43	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.676 प्रतिसाद वेळ (सरासरी) 3.78s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $3.059 प्रतिसाद वेळ (सरासरी) 4.71s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $1.017 प्रतिसाद वेळ (सरासरी) 14.6s
#49	DeepSeek V4 Flash high	DeepSeek	8.2	7.7	$0.041	2/3	26.1s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 26.1s
#51	MiniMax M3 medium	Minimax	7.9	7.6	$0.286	2/3	49.9s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.286 प्रतिसाद वेळ (सरासरी) 49.9s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $1.097 प्रतिसाद वेळ (सरासरी) 18.3s
#53	GLM 5 Turbo medium	Z.ai	8.7	7.6	$0.323	2/3	5.23s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.323 प्रतिसाद वेळ (सरासरी) 5.23s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.352 प्रतिसाद वेळ (सरासरी) 4.04s
#60	GPT-5.4 Mini medium	OpenAI	7.8	7.5	$0.756	2/3	4.37s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.756 प्रतिसाद वेळ (सरासरी) 4.37s
#62	Qwen3.5-27B medium	Qwen	8.2	7.4	$1.627	2/3	59.6s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $1.627 प्रतिसाद वेळ (सरासरी) 59.6s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.661 प्रतिसाद वेळ (सरासरी) 2.53s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.7	7.3	$0.115	2/3	5.30s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.115 प्रतिसाद वेळ (सरासरी) 5.30s
#69	Gemini 3.1 Flash Lite medium	Google	7.6	7.3	$0.117	2/3	1.95s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.117 प्रतिसाद वेळ (सरासरी) 1.95s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $1.166 प्रतिसाद वेळ (सरासरी) 2.74s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	8.2	7.2	$0.482	2/3	3.38s
एकूण चाचण्या 3 चुकीच्या चाचण्या 1 एकूण खर्च $0.482 प्रतिसाद वेळ (सरासरी) 3.38s

कोडी सोडवणे क्रमवारी

मॉडेल फिल्टर करा

कोडी सोडवणे स्कोअर नुसार शीर्ष मॉडेल्स

कोडी सोडवणे स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स