पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#87	GPT-5.6 Sol none	OpenAI	7.7	6.9	$0.524	2/3	1.49s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.524 प्रतिक्रिया समय (औसत) 1.49s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	3.1	5.4	$0.041	0/3	1.57s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 1.57s
#153	Mimo V2 PRO none	Xiaomi	6.0	5.6	$0.045	1/3	1.61s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 1.61s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.646 प्रतिक्रिया समय (औसत) 1.69s
#104	Gemini 3.5 Flash-Lite medium	Google	8.4	6.5	$0.369	2/3	1.70s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.369 प्रतिक्रिया समय (औसत) 1.70s
#75	Qwen3.7 Plus none	Qwen	7.7	7.2	$0.106	2/3	1.71s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 1.71s
#216	LFM2-24B-A2B none	Liquid	3.8	2.2	$0.001	0/3	1.78s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.001 प्रतिक्रिया समय (औसत) 1.78s
#71	Step 3.7 Flash low	Stepfun	5.5	7.3	$0.454	1/3	1.84s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 1.84s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	2.9	4.8	$0.067	0/3	1.84s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.067 प्रतिक्रिया समय (औसत) 1.84s
#31	Gemini 3.5 Flash-Lite high	Google	8.2	8.1	$0.584	2/3	1.85s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.584 प्रतिक्रिया समय (औसत) 1.85s
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	1.86s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 1.86s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	3.6	5.6	$0.048	0/3	1.87s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 1.87s
#147	GLM 5 none	Z.ai	7.7	5.7	$0.041	2/3	1.91s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 1.91s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	3/3	1.91s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.517 प्रतिक्रिया समय (औसत) 1.91s
#204	Laguna Xs.2 medium	Poolside	5.3	4.1	$0.015	1/3	1.93s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 1.93s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल