पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#170	Inkling none	Thinkingmachines	5.6	5.2	$0.147	1/3	931ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.147 प्रतिक्रिया समय (औसत) 931ms
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 15.2s
#33	Step 3.7 Flash medium	Stepfun	5.7	8.0	$0.515	1/3	6.19s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 6.19s
#149	Gemini 3.1 Flash Lite high	Google	5.7	5.6	$2.044	1/3	50.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 50.8s
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.71s
#56	Kimi K2.7 Code medium	Moonshot AI	5.9	7.5	$0.740	1/3	41.0s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 41.0s
#77	Grok 4.3 medium	X AI	5.9	7.1	$0.779	1/3	22.5s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.779 प्रतिक्रिया समय (औसत) 22.5s
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.103 प्रतिक्रिया समय (औसत) 20.7s
#135	Nemotron 3 Ultra none	NVIDIA	5.9	6.1	$0.095	1/3	1.06s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 1.06s
#140	Mimo V2 Omni medium	Xiaomi	5.9	5.9	$0.683	1/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 2.38s
#178	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 24.9s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	5.9	6.9	$0.467	1/3	3.20s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.467 प्रतिक्रिया समय (औसत) 3.20s
#126	Gemini 3.1 Flash Lite minimal	Google	6.0	6.1	$0.047	1/3	2.15s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.15s
#153	Mimo V2 PRO none	Xiaomi	6.0	5.6	$0.045	1/3	1.61s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 1.61s
#35	GLM 5.2 high	Z.ai	6.0	8.0	$0.817	1/3	33.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.817 प्रतिक्रिया समय (औसत) 33.7s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल