AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #12 | Gemini 3 PRO Preview medium | 10.0 | 8.4 | 3/3 | 3.91s | |
| #13 | GLM 5 medium | Z.ai | 10.0 | 8.4 | 3/3 | 15.6s |
| #19 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 8.1 | 3/3 | 17.2s |
| #20 | Qwen3.6 Plus medium | Qwen | 10.0 | 8.1 | 3/3 | 6.11s |
| #22 | Gemini 3.1 Flash Lite Preview low | 10.0 | 8.1 | 3/3 | 2.76s | |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 3/3 | 4.80s |
| #29 | Gemini 3.1 Flash Lite Preview none | 10.0 | 7.9 | 3/3 | 972ms | |
| #36 | GPT-5.3 Chat none | OpenAI | 10.0 | 7.7 | 3/3 | 2.93s |