पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.103 प्रतिक्रिया समय (औसत) 20.7s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.114 प्रतिक्रिया समय (औसत) 20.6s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 20.3s
#143	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 19.7s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.097 प्रतिक्रिया समय (औसत) 18.3s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.046 प्रतिक्रिया समय (औसत) 17.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.317 प्रतिक्रिया समय (औसत) 17.7s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.267 प्रतिक्रिया समय (औसत) 16.4s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 15.2s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.017 प्रतिक्रिया समय (औसत) 14.6s
#42	GLM 5.2 medium	Z.ai	8.2	7.8	$0.187	2/3	13.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 13.1s
#200	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/3	12.9s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.166 प्रतिक्रिया समय (औसत) 12.9s
#194	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 12.8s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.307 प्रतिक्रिया समय (औसत) 11.3s
#196	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.340 प्रतिक्रिया समय (औसत) 11.2s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल