पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Gemini 3 Flash Preview 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ201 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

210/210

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 2.46s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	3/3	5.79s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.089 प्रतिक्रिया समय (औसत) 5.79s
#98	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.231 प्रतिक्रिया समय (औसत) 2.65s
#104	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	3/3	1.69s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.646 प्रतिक्रिया समय (औसत) 1.69s
#105	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	3/3	1.40s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.621 प्रतिक्रिया समय (औसत) 1.40s
#106	Gemini 3.1 Flash Lite Preview none	Google	10.0	6.4	$0.052	3/3	900ms
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 900ms
#110	Gemma 4 31B medium	Google	9.9	6.3	$0.163	3/3	26.9s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.163 प्रतिक्रिया समय (औसत) 26.9s
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	3/3	3.52s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 3.52s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	3/3	3.88s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 3.88s
#157	Mimo V2 Omni none	Xiaomi	10.0	5.5	$0.021	3/3	1.16s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 1.16s
#3	GPT-5.6 Sol low	OpenAI	8.2	9.5	$0.971	2/3	3.44s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.971 प्रतिक्रिया समय (औसत) 3.44s
#4	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.316 प्रतिक्रिया समय (औसत) 2.98s
#9	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.642 प्रतिक्रिया समय (औसत) 2.38s
#13	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.920 प्रतिक्रिया समय (औसत) 5.05s
#16	Muse Spark 1.1 medium	Meta	7.9	8.6	$1.357	2/3	42.5s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $1.357 प्रतिक्रिया समय (औसत) 42.5s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल