पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Muse Spark 1.1 7.8

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.166 प्रतिक्रिया समय (औसत) 2.74s
#117	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 2.74s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.073 प्रतिक्रिया समय (औसत) 2.71s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 2.65s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.65s
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.661 प्रतिक्रिया समय (औसत) 2.53s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	3/3	2.53s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.831 प्रतिक्रिया समय (औसत) 2.53s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	3.5	5.6	$0.077	0/3	2.47s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.077 प्रतिक्रिया समय (औसत) 2.47s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 2.46s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	3/3	2.43s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.477 प्रतिक्रिया समय (औसत) 2.43s
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.40s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.40s
#12	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.642 प्रतिक्रिया समय (औसत) 2.38s
#140	Mimo V2 Omni medium	Xiaomi	5.9	5.9	$0.683	1/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 2.38s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 2.36s
#14	Gemini 3.5 Flash low	Google	10.0	8.9	$0.433	3/3	2.35s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 2.35s

←

1 9 10 11 15

→

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल