पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#56	Kimi K2.7 Code medium	Moonshot AI	5.9	7.5	$0.740	1/3	41.0s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.740 प्रतिक्रिया समय (औसत) 41.0s
#202	Hunter Alpha none	OpenRouter	5.8	4.2	$0.000	1/3	3.71s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.71s
#149	Gemini 3.1 Flash Lite high	Google	5.7	5.6	$2.044	1/3	50.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 50.8s
#33	Step 3.7 Flash medium	Stepfun	5.7	8.0	$0.515	1/3	6.19s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 6.19s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.237 प्रतिक्रिया समय (औसत) 15.2s
#170	Inkling none	Thinkingmachines	5.6	5.2	$0.147	1/3	931ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.147 प्रतिक्रिया समय (औसत) 931ms
#145	GPT-5.4 none	OpenAI	5.6	5.8	$0.397	1/3	1.44s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.397 प्रतिक्रिया समय (औसत) 1.44s
#71	Step 3.7 Flash low	Stepfun	5.5	7.3	$0.454	1/3	1.84s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 1.84s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 2.36s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.65s
#55	Nemotron 3 Ultra medium	NVIDIA	5.5	7.5	$0.774	1/3	3.54s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.774 प्रतिक्रिया समय (औसत) 3.54s
#64	LongCat 2.0 medium	Meituan	5.4	7.4	$0.478	1/3	8.84s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.478 प्रतिक्रिया समय (औसत) 8.84s
#82	Mercury 2 medium	Inception	5.4	7.0	$0.093	1/3	949ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.093 प्रतिक्रिया समय (औसत) 949ms
#142	GPT-5.4 Mini none	OpenAI	5.4	5.9	$0.095	1/3	836ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 836ms
#174	MiMo-V2.5 none	Xiaomi	5.4	5.1	$0.025	1/3	2.13s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 2.13s

←

1 9 10 11 15

→

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल