AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #88 | Nemotron 3 Super none | NVIDIA | 5.7 | 5.1 | 1/3 | 7.50s |
| #72 | Hunter Alpha none | OpenRouter | 5.8 | 5.7 | 1/3 | 3.06s |
| #79 | Grok 4.20 Beta none | X AI | 5.9 | 5.3 | 1/3 | 541ms |
| #65 | MiMo-V2-Pro none | Xiaomi | 6.0 | 6.0 | 1/3 | 1.83s |
| #50 | Hunter Alpha medium | OpenRouter | 6.1 | 6.7 | 1/3 | 5.36s |
| #47 | Grok 4.20 medium | X AI | 6.4 | 7.0 | 1/3 | 3.89s |
| #32 | Qwen3.5-Flash medium | Qwen | 6.4 | 7.8 | 1/3 | 56.7s |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 6.4 | 7.4 | 1/3 | 31.6s |
| #35 | MiMo-V2-Omni medium | Xiaomi | 6.5 | 7.7 | 1/3 | 3.88s |
| #67 | Qwen3.5-27B none | Qwen | 6.7 | 5.9 | 1/3 | 1.37s |
| #44 | GPT-5.4 Mini medium | OpenAI | 6.8 | 7.3 | 1/3 | 4.33s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 7.0 | 8.1 | 1/3 | 4.71s |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 7.2 | 6.4 | 1/3 | 5.01s |
| #18 | GLM 5 Turbo medium | Z.ai | 7.3 | 8.1 | 1/3 | 5.44s |
| #11 | Gemini 3.1 Flash Lite Preview high | 7.7 | 8.4 | 2/3 | 46.3s |