पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	3/3	3.61s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 3.61s
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.71s
#43	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 3.78s
#57	GPT-5.4 Nano medium	OpenAI	4.1	7.5	$0.138	0/3	3.79s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.138 प्रतिक्रिया समय (औसत) 3.79s
#119	MiMo-V2-Flash medium	Xiaomi	7.7	6.3	$0.043	2/3	3.87s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 3.87s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 3.88s
#17	Claude Opus 4.8 medium	Anthropic	10.0	8.8	$1.931	3/3	3.95s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 3.95s
#161	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.127	0/3	4.04s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 4.04s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.352 प्रतिक्रिया समय (औसत) 4.04s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	4.05s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.742 प्रतिक्रिया समय (औसत) 4.05s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	3/3	4.10s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.234 प्रतिक्रिया समय (औसत) 4.10s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.604 प्रतिक्रिया समय (औसत) 4.10s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 4.18s
#121	Gemma 4 31B none	Google	6.5	6.2	$0.021	1/3	4.23s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 4.23s
#60	GPT-5.4 Mini medium	OpenAI	7.8	7.5	$0.756	2/3	4.37s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.756 प्रतिक्रिया समय (औसत) 4.37s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल