पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#106	Hy3 preview medium	Tencent	7.7	6.5	$0.018	2/3	11.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 11.1s
#131	Qwen3.5-Flash none	Qwen	3.1	6.1	$0.073	0/3	10.9s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.073 प्रतिक्रिया समय (औसत) 10.9s
#32	Inkling high	Thinkingmachines	6.9	8.0	$1.006	1/3	10.7s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.006 प्रतिक्रिया समय (औसत) 10.7s
#98	GLM 5V Turbo medium	Z.ai	7.7	6.7	$0.457	2/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.457 प्रतिक्रिया समय (औसत) 10.2s
#39	Seed-2.0-Lite medium	Bytedance Seed	9.0	7.9	$0.234	2/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 10.2s
#90	Step 3.7 Flash high	Stepfun	5.3	6.9	$1.207	1/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $1.207 प्रतिक्रिया समय (औसत) 10.2s
#192	Laguna M.1 medium	Poolside	5.3	4.7	$0.033	1/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 10.2s
#208	Grok Build 0.1 none	X AI	6.4	4.0	$0.547	1/3	9.55s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.547 प्रतिक्रिया समय (औसत) 9.55s
#102	LongCat 2.0 high	Meituan	3.1	6.6	$0.469	0/3	9.18s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.469 प्रतिक्रिया समय (औसत) 9.18s
#21	GPT-5.4 medium	OpenAI	8.2	8.5	$1.533	2/3	9.14s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.533 प्रतिक्रिया समय (औसत) 9.14s
#64	LongCat 2.0 medium	Meituan	5.4	7.4	$0.478	1/3	8.84s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.478 प्रतिक्रिया समय (औसत) 8.84s
#11	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	3/3	8.84s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.116 प्रतिक्रिया समय (औसत) 8.84s
#212	gpt-oss-120b none	OpenAI	6.0	3.7	$0.010	1/3	8.21s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 8.21s
#96	LongCat 2.0 low	Meituan	3.1	6.7	$0.391	0/3	8.15s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.391 प्रतिक्रिया समय (औसत) 8.15s
#15	Grok 4.5 high	X AI	10.0	8.9	$1.707	3/3	7.88s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.707 प्रतिक्रिया समय (औसत) 7.88s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल