AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #39 | Seed-2.0-Mini medium | Bytedance Seed | 8.2 | 7.5 | 2/3 | 25.9s |
| #40 | GPT-5.2 medium | OpenAI | 7.7 | 7.5 | 2/3 | 5.47s |
| #41 | MiMo-V2-Flash medium | Xiaomi | 7.7 | 7.5 | 2/3 | 3.77s |
| #42 | Claude Sonnet 4.6 none | Anthropic | 7.7 | 7.4 | 2/3 | 2.92s |
| #49 | Qwen3.5 Plus 2026-02-15 none | Qwen | 7.7 | 6.8 | 2/3 | 2.82s |
| #53 | GLM 5 none | Z.ai | 7.7 | 6.6 | 2/3 | 2.05s |
| #55 | MiMo-V2-Omni none | Xiaomi | 8.0 | 6.5 | 2/3 | 2.71s |
| #64 | DeepSeek V3.2 none | DeepSeek | 8.5 | 6.1 | 2/3 | 7.37s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 10.0 | 3/3 | 4.43s | |
| #2 | Gemini 3.1 Pro Preview medium | 10.0 | 9.6 | 3/3 | 7.15s | |
| #3 | Claude Opus 4.7 medium | Anthropic | 10.0 | 9.2 | 3/3 | 2.51s |
| #4 | Claude Opus 4.7 none | Anthropic | 10.0 | 9.2 | 3/3 | 2.58s |
| #5 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 3/3 | 6.11s | |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 8.5 | 3/3 | 34.6s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 3/3 | 6.11s |