पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 3.88s
#119	MiMo-V2-Flash medium	Xiaomi	7.7	6.3	$0.043	2/3	3.87s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 3.87s
#57	GPT-5.4 Nano medium	OpenAI	4.1	7.5	$0.138	0/3	3.79s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.138 प्रतिक्रिया समय (औसत) 3.79s
#43	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 3.78s
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.71s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	3/3	3.61s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 3.61s
#123	GPT-5.6 Luna low	OpenAI	7.6	6.2	$0.249	2/3	3.59s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.249 प्रतिक्रिया समय (औसत) 3.59s
#55	Nemotron 3 Ultra medium	NVIDIA	5.5	7.5	$0.774	1/3	3.54s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.774 प्रतिक्रिया समय (औसत) 3.54s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	3/3	3.52s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 3.52s
#5	GPT-5.6 Sol low	OpenAI	8.2	9.5	$0.971	2/3	3.44s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.971 प्रतिक्रिया समय (औसत) 3.44s
#108	Laguna XS 2.1 medium	Poolside	5.3	6.5	$0.068	1/3	3.43s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 3.43s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	3.40s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.40s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	8.2	7.2	$0.482	2/3	3.38s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.482 प्रतिक्रिया समय (औसत) 3.38s
#101	GLM 5.2 none	Z.ai	7.7	6.6	$0.128	2/3	3.31s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.128 प्रतिक्रिया समय (औसत) 3.31s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	3/3	3.23s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.976 प्रतिक्रिया समय (औसत) 3.23s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल