AI BENCHY বিভাগ
ধাঁধা সমাধান র্যাঙ্কিং
দেখুন ধাঁধা সমাধান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: মেট্রিক ↑.
| র্যাঙ্ক | মডেল | কোম্পানি | ধাঁধা সমাধান স্কোর | স্কোর | সঠিক টেস্ট | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|
| #88 | Nemotron 3 Super none | NVIDIA | 5.7 | 5.1 | 1/3 | 7.50s |
| #72 | Hunter Alpha none | OpenRouter | 5.8 | 5.7 | 1/3 | 3.06s |
| #79 | Grok 4.20 Beta none | X AI | 5.9 | 5.3 | 1/3 | 541ms |
| #65 | MiMo-V2-Pro none | Xiaomi | 6.0 | 6.0 | 1/3 | 1.83s |
| #50 | Hunter Alpha medium | OpenRouter | 6.1 | 6.7 | 1/3 | 5.36s |
| #47 | Grok 4.20 medium | X AI | 6.4 | 7.0 | 1/3 | 3.89s |
| #32 | Qwen3.5-Flash medium | Qwen | 6.4 | 7.8 | 1/3 | 56.7s |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 6.4 | 7.4 | 1/3 | 31.6s |
| #35 | MiMo-V2-Omni medium | Xiaomi | 6.5 | 7.7 | 1/3 | 3.88s |
| #67 | Qwen3.5-27B none | Qwen | 6.7 | 5.9 | 1/3 | 1.37s |
| #44 | GPT-5.4 Mini medium | OpenAI | 6.8 | 7.3 | 1/3 | 4.33s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 7.0 | 8.1 | 1/3 | 4.71s |
| #56 | Grok 4.20 Multi Agent Beta medium | X AI | 7.2 | 6.4 | 1/3 | 5.01s |
| #18 | GLM 5 Turbo medium | Z.ai | 7.3 | 8.1 | 1/3 | 5.44s |
| #11 | Gemini 3.1 Flash Lite Preview high | 7.7 | 8.4 | 2/3 | 46.3s |