पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Gemini 3.6 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	6.7	6.1	$0.122	1/3	1.97s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 1.97s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.114 प्रतिक्रिया समय (औसत) 20.6s
#135	Nemotron 3 Ultra none	NVIDIA	5.9	6.1	$0.095	1/3	1.06s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 1.06s
#136	Step 3.5 Flash medium	Stepfun	5.3	6.0	$0.108	1/3	7.22s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.108 प्रतिक्रिया समय (औसत) 7.22s
#138	GPT-5.6 Terra none	OpenAI	5.3	6.0	$0.349	1/3	1.23s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.23s
#140	Mimo V2 Omni medium	Xiaomi	5.9	5.9	$0.683	1/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 2.38s
#142	GPT-5.4 Mini none	OpenAI	5.4	5.9	$0.095	1/3	836ms
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 836ms
#145	GPT-5.4 none	OpenAI	5.6	5.8	$0.397	1/3	1.44s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.397 प्रतिक्रिया समय (औसत) 1.44s
#149	Gemini 3.1 Flash Lite high	Google	5.7	5.6	$2.044	1/3	50.8s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 50.8s
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.40s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.40s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	3.40s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 3.40s
#153	Mimo V2 PRO none	Xiaomi	6.0	5.6	$0.045	1/3	1.61s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.045 प्रतिक्रिया समय (औसत) 1.61s
#154	Owl Alpha none	Openrouter	5.4	5.6	$0.000	1/3	4.18s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 4.18s
#158	Qwen3.6 27B none	Qwen	5.3	5.5	$0.087	1/3	5.15s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 5.15s
#159	Hy3 preview low	Tencent	5.3	5.5	$0.015	1/3	7.51s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 7.51s

←

1 9 10 11 15

→

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल