पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 2.46s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	3/3	5.79s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.089 प्रतिक्रिया समय (औसत) 5.79s
#98	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 2.65s
#104	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.646 प्रतिक्रिया समय (औसत) 1.69s
#105	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	3/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.621 प्रतिक्रिया समय (औसत) 1.40s
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	3/3	900ms
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 900ms
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	3/3	3.52s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 3.52s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 3.88s
#157	Mimo V2 Omni none	Xiaomi	10.0	5.5	$0.021	3/3	1.16s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 1.16s
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 26.9s
#13	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 5.05s
#35	Seed-2.0-Lite medium	Bytedance Seed	9.0	7.9	$0.234	2/3	10.2s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.234 प्रतिक्रिया समय (औसत) 10.2s
#49	GLM 5 Turbo medium	Z.ai	8.7	7.6	$0.323	2/3	5.23s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.323 प्रतिक्रिया समय (औसत) 5.23s
#39	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 3.78s
#24	Muse Spark 1.1 low	Meta	8.3	8.3	$0.647	2/3	6.60s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.647 प्रतिक्रिया समय (औसत) 6.60s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल