पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#3	GPT-5.6 Sol low	OpenAI	8.2	9.5	$0.971	2/3	3.44s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.971 प्रतिक्रिया समय (औसत) 3.44s
#4	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.316 प्रतिक्रिया समय (औसत) 2.98s
#18	GPT-5.4 medium	OpenAI	8.2	8.5	$1.533	2/3	9.14s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.533 प्रतिक्रिया समय (औसत) 9.14s
#38	GLM 5.2 medium	Z.ai	8.2	7.8	$0.222	2/3	13.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.222 प्रतिक्रिया समय (औसत) 13.1s
#45	DeepSeek V4 Flash high	DeepSeek	8.2	7.7	$0.042	2/3	26.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.042 प्रतिक्रिया समय (औसत) 26.1s
#69	KAT-Coder-Pro V2.5 high	Kwaipilot	8.2	7.2	$0.482	2/3	3.38s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.482 प्रतिक्रिया समय (औसत) 3.38s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.317 प्रतिक्रिया समय (औसत) 17.7s
#74	GLM 5.1 medium	Z.ai	8.2	7.1	$0.535	2/3	31.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.535 प्रतिक्रिया समय (औसत) 31.6s
#80	Seed-2.0-Mini medium	Bytedance Seed	8.2	7.0	$0.101	2/3	31.8s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.101 प्रतिक्रिया समय (औसत) 31.8s
#85	Qwen3.6 Flash medium	Qwen	8.2	6.9	$0.738	2/3	6.29s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.738 प्रतिक्रिया समय (औसत) 6.29s
#92	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.476 प्रतिक्रिया समय (औसत) 3.03s
#101	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.082 प्रतिक्रिया समय (औसत) 20.3s
#114	Qwen3.5-Flash medium	Qwen	8.2	6.2	$0.139	2/3	27.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.139 प्रतिक्रिया समय (औसत) 27.6s
#119	Qwen3.5-35B-A3B medium	Qwen	8.2	6.2	$0.837	2/3	33.1s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.837 प्रतिक्रिया समय (औसत) 33.1s
#58	Qwen3.5-27B medium	Qwen	8.2	7.4	$1.627	2/3	59.6s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.627 प्रतिक्रिया समय (औसत) 59.6s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल