AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #118 | Qwen3.6 27B none | Qwen | 5.3 | 5.6 | 1/3 | 5.15s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 6.7 | 6.6 | 1/3 | 5.19s |
| #23 | GLM 5 Turbo medium | Z.ai | 8.7 | 8.0 | 2/3 | 5.23s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 7.7 | 7.5 | 2/3 | 5.30s | |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 7.4 | 3/3 | 5.31s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 6.7 | 7.5 | 1/3 | 5.31s |
| #79 | Hunter Alpha medium | OpenRouter | 6.1 | 6.7 | 1/3 | 5.35s |
| #159 | Ling-2.6-1T none | Inclusionai | 3.1 | 4.3 | 0/3 | 5.36s |
| #16 | Gemini 3 Flash Preview low | 10.0 | 8.4 | 3/3 | 5.77s | |
| #37 | Gemma 4 26B A4B medium | 10.0 | 7.6 | 3/3 | 5.79s | |
| #42 | GPT-5.2 medium | OpenAI | 7.5 | 7.5 | 2/3 | 5.80s |
| #46 | Qwen3.6 35B A3B medium | Qwen | 8.0 | 7.4 | 2/3 | 5.95s |
| #22 | Step 3.7 Flash medium | Stepfun | 5.7 | 8.0 | 1/3 | 6.19s |
| #65 | Grok 4.20 medium | X AI | 7.7 | 7.1 | 2/3 | 6.22s |
| #39 | Qwen3.6 Flash medium | Qwen | 8.2 | 7.5 | 2/3 | 6.29s |