पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#115	Mimo V2 PRO medium	Xiaomi	6.4	6.3	$0.333	1/3	5.08s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 5.08s
#16	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 5.05s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	3/3	4.74s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.253 प्रतिक्रिया समय (औसत) 4.74s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $3.059 प्रतिक्रिया समय (औसत) 4.71s
#205	Hy3 preview none	Tencent	3.1	4.0	$0.003	0/3	4.56s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 4.56s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	3/3	4.46s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.519 प्रतिक्रिया समय (औसत) 4.46s
#60	GPT-5.4 Mini medium	OpenAI	7.8	7.5	$0.756	2/3	4.37s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.756 प्रतिक्रिया समय (औसत) 4.37s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/3	4.23s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 4.23s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 4.18s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 4.10s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	3/3	4.10s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.234 प्रतिक्रिया समय (औसत) 4.10s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	4.05s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.742 प्रतिक्रिया समय (औसत) 4.05s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.352 प्रतिक्रिया समय (औसत) 4.04s
#161	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.127	0/3	4.04s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 4.04s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	3/3	3.95s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 3.95s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल