कोडिंग मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि कोडिंग में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत कोडिंग स्कोर

5.7

सर्वश्रेष्ठ मॉडल

Gemini 3 PRO Preview 3.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ230 विफलता कारण API त्रुटि के साथ43 विफलता कारण समय समाप्त के साथ25 विफलता कारण कोई उत्तर नहीं के साथ18 विफलता कारण निर्देशों का पालन नहीं किया के साथ16 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ12

189/189

रैंक	मॉडल	कंपनी	कोडिंग स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#70	Claude Opus 4.8 none	Anthropic	5.5	7.2	$0.539	1/3	3.29s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.539 प्रतिक्रिया समय (औसत) 3.29s
#132	Claude Sonnet 5 none	Anthropic	4.6	5.7	$0.287	0/3	3.67s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.287 प्रतिक्रिया समय (औसत) 3.67s
#43	Gemini 3.1 Flash Lite medium	Google	5.5	7.8	$0.071	1/3	3.81s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.071 प्रतिक्रिया समय (औसत) 3.81s
#41	Gemini 3.1 Flash Lite Preview medium	Google	5.5	7.8	$0.068	1/3	4.09s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 4.09s
#139	Gemma 4 26B A4B none	Google	3.7	5.5	$0.004	0/3	4.16s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.004 प्रतिक्रिया समय (औसत) 4.16s
#138	Qwen3.6 27B none	Qwen	5.5	5.5	$0.025	1/3	4.16s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 4.16s
#178	Hy3 preview none	Tencent	2.7	4.3	$0.003	0/3	4.56s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 4.56s
#108	GPT-5.6 Luna low	OpenAI	5.5	6.2	$0.141	1/3	4.61s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.141 प्रतिक्रिया समय (औसत) 4.61s
#134	GLM 5.1 none	Z.ai	3.9	5.6	$0.057	0/3	4.96s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 4.96s
#118	GLM 5 none	Z.ai	4.0	6.0	$0.027	0/3	5.12s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.027 प्रतिक्रिया समय (औसत) 5.12s
#68	Claude Sonnet 4.6 none	Anthropic	5.5	7.3	$0.316	1/3	5.19s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.316 प्रतिक्रिया समय (औसत) 5.19s
#155	Qwen3.5-9B none	Qwen	3.9	5.1	$0.006	0/3	5.60s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.006 प्रतिक्रिया समय (औसत) 5.60s
#65	Gemini 3 Flash Preview low	Google	5.8	7.4	$0.111	1/3	6.00s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.111 प्रतिक्रिया समय (औसत) 6.00s
#8	Gemini 3.5 Flash low	Google	7.8	9.2	$0.349	2/3	6.71s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 6.71s
#38	GPT-5.6 Terra medium	OpenAI	6.1	7.8	$0.496	1/3	7.19s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.496 प्रतिक्रिया समय (औसत) 7.19s

कोडिंग रैंकिंग

मॉडल फ़िल्टर करें

कोडिंग स्कोर के अनुसार शीर्ष मॉडल

कोडिंग स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल