पहेली समाधान मॉडल रैंकिंग

देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत पहेली समाधान स्कोर

6.7

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 0.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ204 विफलता कारण निर्देशों का पालन नहीं किया के साथ90 विफलता कारण API त्रुटि के साथ12 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ8 विफलता कारण समय समाप्त के साथ5 विफलता कारण कोई उत्तर नहीं के साथ3

216/216

रैंक	मॉडल	कंपनी	पहेली समाधान स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#69	Gemini 3.1 Flash Lite medium	Google	7.6	7.3	$0.117	2/3	1.95s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.117 प्रतिक्रिया समय (औसत) 1.95s
#189	Trinity Large Preview none	Arcee AI	3.6	4.8	$0.008	0/3	1.97s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 1.97s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	6.7	6.1	$0.122	1/3	1.97s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 1.97s
#174	MiMo-V2.5 none	Xiaomi	5.4	5.1	$0.025	1/3	2.13s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 2.13s
#126	Gemini 3.1 Flash Lite minimal	Google	6.0	6.1	$0.047	1/3	2.15s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.15s
#173	Mistral Small 4 medium	Mistral	3.4	5.1	$0.096	0/3	2.17s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 2.17s
#14	Gemini 3.5 Flash low	Google	10.0	8.9	$0.433	3/3	2.35s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.433 प्रतिक्रिया समय (औसत) 2.35s
#183	Nemotron 3 Super none	NVIDIA	5.5	4.9	$0.008	1/3	2.36s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 2.36s
#140	Mimo V2 Omni medium	Xiaomi	5.9	5.9	$0.683	1/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 2.38s
#12	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	2.38s
कुल टेस्ट 3 गलत टेस्ट 1 कुल लागत $0.642 प्रतिक्रिया समय (औसत) 2.38s
#151	GLM 5V Turbo none	Z.ai	5.3	5.6	$0.052	1/3	2.40s
कुल टेस्ट 3 गलत टेस्ट 2 कुल लागत $0.052 प्रतिक्रिया समय (औसत) 2.40s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	3/3	2.43s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $1.477 प्रतिक्रिया समय (औसत) 2.43s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	3/3	2.46s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.505 प्रतिक्रिया समय (औसत) 2.46s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	3.5	5.6	$0.077	0/3	2.47s
कुल टेस्ट 3 गलत टेस्ट 3 कुल लागत $0.077 प्रतिक्रिया समय (औसत) 2.47s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	3/3	2.53s
कुल टेस्ट 3 गलत टेस्ट 0 कुल लागत $0.831 प्रतिक्रिया समय (औसत) 2.53s

पहेली समाधान रैंकिंग

मॉडल फ़िल्टर करें

पहेली समाधान स्कोर के अनुसार शीर्ष मॉडल

पहेली समाधान स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल