AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #42 | Claude Sonnet 4.6 none | Anthropic | 7.7 | 7.4 | 2/3 | 2.92s |
| #49 | Qwen3.5 Plus 2026-02-15 none | Qwen | 7.7 | 6.8 | 2/3 | 2.82s |
| #22 | Gemini 3.1 Flash Lite Preview low | 10.0 | 8.1 | 3/3 | 2.76s | |
| #55 | MiMo-V2-Omni none | Xiaomi | 8.0 | 6.5 | 2/3 | 2.71s |
| #4 | Claude Opus 4.7 none | Anthropic | 10.0 | 9.2 | 3/3 | 2.58s |
| #3 | Claude Opus 4.7 medium | Anthropic | 10.0 | 9.2 | 3/3 | 2.51s |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 5.2 | 6.2 | 1/3 | 2.46s |
| #77 | GLM 5 Turbo none | Z.ai | 5.5 | 5.5 | 1/3 | 2.43s |
| #92 | Qwen3 Coder Next medium | Qwen | 3.1 | 4.7 | 0/3 | 2.30s |
| #58 | GLM 5V Turbo none | Z.ai | 5.3 | 6.2 | 1/3 | 2.22s |
| #53 | GLM 5 none | Z.ai | 7.7 | 6.6 | 2/3 | 2.05s |
| #73 | Mistral Small 4 medium | Mistral | 3.4 | 5.7 | 0/3 | 2.00s |
| #65 | MiMo-V2-Pro none | Xiaomi | 6.0 | 6.0 | 1/3 | 1.83s |
| #98 | LFM2-24B-A2B none | Liquid | 4.4 | 4.1 | 0/3 | 1.69s |
| #69 | Kimi K2.6 none | Moonshot AI | 3.4 | 5.8 | 0/3 | 1.66s |