पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#80	Seed-2.0-Mini medium	Bytedance Seed	8.2	7.0	$0.101	2/3	31.8s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.101 प्रतिक्रिया समय (औसत) 31.8s
#74	GLM 5.1 medium	Z.ai	8.2	7.1	$0.535	2/3	31.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.535 प्रतिक्रिया समय (औसत) 31.6s
#179	Ring-2.6-1T none	Inclusionai	7.7	4.8	$0.026	2/3	31.5s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.026 प्रतिक्रिया समय (औसत) 31.5s
#135	Hy3 preview high	Tencent	7.7	5.9	$0.048	2/3	27.9s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 27.9s
#114	Qwen3.5-Flash medium	Qwen	8.2	6.2	$0.139	2/3	27.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.139 प्रतिक्रिया समय (औसत) 27.6s
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 26.9s
#45	DeepSeek V4 Flash high	DeepSeek	8.2	7.7	$0.042	2/3	26.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.042 प्रतिक्रिया समय (औसत) 26.1s
#68	Kimi K2.6 medium	Moonshot AI	6.0	7.2	$1.036	1/3	25.1s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.036 प्रतिक्रिया समय (औसत) 25.1s
#172	MiniMax M2.7 medium	Minimax	5.9	5.0	$0.163	1/3	24.9s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 24.9s
#171	North Mini Code none	Cohere	3.5	5.1	$0.000	0/3	24.4s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 24.4s
#166	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.025	0/3	24.3s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 24.3s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	3/3	24.3s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.143 प्रतिक्रिया समय (औसत) 24.3s
#150	DeepSeek V4 Flash none	DeepSeek	3.1	5.6	$0.044	0/3	23.7s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 23.7s
#73	Grok 4.3 medium	X AI	5.9	7.1	$0.779	1/3	22.5s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.779 प्रतिक्रिया समय (औसत) 22.5s
#121	gpt-oss-120b medium	OpenAI	5.3	6.1	$0.019	1/3	21.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.019 प्रतिक्रिया समय (औसत) 21.7s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल