पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#124	Qwen3.6 Flash none	Qwen	3.5	6.1	$0.062	0/3	1.21s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.062 प्रतिक्रिया समय (औसत) 1.21s
#132	GPT-5.6 Terra none	OpenAI	5.3	6.0	$0.349	1/3	1.23s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.23s
#187	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/3	1.25s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.032 प्रतिक्रिया समय (औसत) 1.25s
#180	GPT-5.4 Nano none	OpenAI	5.4	4.8	$0.041	1/3	1.25s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 1.25s
#87	GPT-5.5 none	OpenAI	7.7	6.9	$0.544	2/3	1.29s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.544 प्रतिक्रिया समय (औसत) 1.29s
#154	MiMo-V2.5-Pro none	Xiaomi	6.7	5.5	$0.068	1/3	1.30s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 1.30s
#127	Qwen3.5-35B-A3B none	Qwen	3.7	6.1	$0.106	0/3	1.35s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 1.35s
#103	Qwen3.5-27B none	Qwen	6.7	6.5	$0.090	1/3	1.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.090 प्रतिक्रिया समय (औसत) 1.38s
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	2.9	3.4	$0.000	0/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 1.40s
#138	Kimi K2.6 none	Moonshot AI	3.1	5.8	$0.184	0/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.184 प्रतिक्रिया समय (औसत) 1.40s
#105	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	3/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.621 प्रतिक्रिया समय (औसत) 1.40s
#139	GPT-5.4 none	OpenAI	5.6	5.8	$0.397	1/3	1.44s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.397 प्रतिक्रिया समय (औसत) 1.44s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	1.45s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.300 प्रतिक्रिया समय (औसत) 1.45s
#151	GLM 5.1 none	Z.ai	7.7	5.5	$0.164	2/3	1.45s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.164 प्रतिक्रिया समय (औसत) 1.45s
#83	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.524 प्रतिक्रिया समय (औसत) 1.49s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल