पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#94	Qwen3.6 35B A3B medium	Qwen	8.0	6.7	$0.746	2/3	5.95s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.746 प्रतिक्रिया समय (औसत) 5.95s
#24	GPT-5.2 medium	OpenAI	7.5	8.4	$0.951	2/3	5.80s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.951 प्रतिक्रिया समय (औसत) 5.80s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	3/3	5.79s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.089 प्रतिक्रिया समय (औसत) 5.79s
#65	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	3/3	5.77s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.177 प्रतिक्रिया समय (औसत) 5.77s
#38	GPT-5.6 Terra high	OpenAI	7.7	8.0	$1.055	2/3	5.45s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.055 प्रतिक्रिया समय (औसत) 5.45s
#168	Ling-2.6-1T none	Inclusionai	3.1	5.3	$0.016	0/3	5.36s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 5.36s
#190	Hunter Alpha medium	OpenRouter	6.1	4.7	$0.000	1/3	5.35s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 5.35s
#88	MiMo-V2.5-Pro medium	Xiaomi	6.7	6.9	$0.187	1/3	5.31s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 5.31s
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	3/3	5.31s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $2.057 प्रतिक्रिया समय (औसत) 5.31s
#68	Gemini 3.1 Flash Lite Preview medium	Google	7.7	7.3	$0.115	2/3	5.30s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.115 प्रतिक्रिया समय (औसत) 5.30s
#53	GLM 5 Turbo medium	Z.ai	8.7	7.6	$0.323	2/3	5.23s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.323 प्रतिक्रिया समय (औसत) 5.23s
#187	Grok 4.20 Multi Agent Beta medium	X AI	6.7	4.8	$5.599	1/3	5.19s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $5.599 प्रतिक्रिया समय (औसत) 5.19s
#20	Claude Fable 5 medium	Anthropic	7.7	8.6	$3.478	2/3	5.18s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $3.478 प्रतिक्रिया समय (औसत) 5.18s
#36	Inkling medium	Thinkingmachines	10.0	8.0	$0.391	3/3	5.18s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.391 प्रतिक्रिया समय (औसत) 5.18s
#158	Qwen3.6 27B none	Qwen	5.3	5.5	$0.087	1/3	5.15s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 5.15s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल