पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#195	Elephant Alpha medium	Openrouter	5.3	4.3	$0.000	1/3	868ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 868ms
#192	Laguna M.1 none	Poolside	3.0	4.4	$0.009	0/3	891ms
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.009 प्रतिक्रिया समय (औसत) 891ms
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	3/3	900ms
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 900ms
#164	Inkling none	Thinkingmachines	5.6	5.2	$0.147	1/3	931ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.147 प्रतिक्रिया समय (औसत) 931ms
#78	Mercury 2 medium	Inception	5.4	7.0	$0.093	1/3	949ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.093 प्रतिक्रिया समय (औसत) 949ms
#142	Qwen3.5-122B-A10B none	Qwen	3.8	5.7	$0.247	0/3	1.00s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.247 प्रतिक्रिया समय (औसत) 1.00s
#160	Laguna XS 2.1 none	Poolside	3.0	5.3	$0.008	0/3	1.01s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 1.01s
#89	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	1.05s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.085 प्रतिक्रिया समय (औसत) 1.05s
#129	Nemotron 3 Ultra none	NVIDIA	5.9	6.1	$0.095	1/3	1.06s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 1.06s
#161	Qwen3.6 35B A3B none	Qwen	3.2	5.3	$0.061	0/3	1.07s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.061 प्रतिक्रिया समय (औसत) 1.07s
#203	Grok 4.1 Fast none	X AI	3.0	3.8	$0.008	0/3	1.10s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 1.10s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	3/3	1.13s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.197 प्रतिक्रिया समय (औसत) 1.13s
#157	Mimo V2 Omni none	Xiaomi	10.0	5.5	$0.021	3/3	1.16s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 1.16s
#176	GLM 4.7 Flash none	Z.ai	6.4	4.9	$0.016	1/3	1.20s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 1.20s
#174	GPT-4o-mini none	OpenAI	3.5	5.0	$0.010	0/3	1.21s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 1.21s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल