संयुक्त मॉडल रैंकिंग

AI BENCHY श्रेणी

देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत संयुक्त स्कोर

6.3

सर्वश्रेष्ठ मॉडल

Ring-2.6-1T 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ52 विफलता कारण अमान्य टूल कॉल के साथ19 विफलता कारण API त्रुटि के साथ13 विफलता कारण कोई उत्तर नहीं के साथ2 विफलता कारण समय समाप्त के साथ2 विफलता कारण निर्देशों का पालन नहीं किया के साथ1

रैंक	मॉडल	कंपनी	संयुक्त स्कोर	स्कोर	सही परीक्षण	प्रतिक्रिया समय (औसत)
#75	Ring-2.6-1T medium	Inclusionai	10.0	6.9	1/1	304.2s
#12	Gemini 3.1 Flash Lite Preview high	Google	10.0	8.6	1/1	280.5s
#73	Seed-2.0-Mini medium	Bytedance Seed	10.0	6.9	1/1	262.8s
#30	Qwen3.5-27B medium	Qwen	10.0	7.8	1/1	164.0s
#53	Gemini 3.1 Flash Lite high	Google	10.0	7.3	1/1	149.2s
#14	Qwen3.6 Max Preview medium	Qwen	10.0	8.5	1/1	121.5s
#133	DeepSeek V3.2 none	DeepSeek	6.5	5.2	0/1	115.9s
#82	Hy3 preview high	Tencent	10.0	6.6	1/1	113.1s
#139	DeepSeek V4 Flash none	DeepSeek	4.5	5.0	0/1	112.0s
#29	Qwen3.5-122B-A10B medium	Qwen	10.0	7.8	1/1	107.8s
#72	DeepSeek V3.2 medium	DeepSeek	10.0	7.0	1/1	93.1s
#36	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.6	1/1	92.4s
#54	GPT-5 Mini medium	OpenAI	10.0	7.3	1/1	88.2s
#105	Nemotron 3 Super medium	NVIDIA	10.0	5.8	1/1	87.8s
#78	Qwen3.6 27B medium	Qwen	7.0	6.8	0/1	83.1s

1 2 11

→

संयुक्त रैंकिंग

संयुक्त स्कोर के अनुसार शीर्ष मॉडल

संयुक्त स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल