AI BENCHY श्रेणी
पहेली समाधान रैंकिंग
देखें कि पहेली समाधान में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | पहेली समाधान स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 8.2 | 6.9 | 2/3 | 31.8s |
| #161 | Qwen3.5-9B medium | Qwen | 3.0 | 4.2 | 0/3 | 32.3s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 7.9 | 3/3 | 32.5s |
| #66 | Qwen3.5-35B-A3B medium | Qwen | 8.2 | 7.1 | 2/3 | 33.1s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 5.9 | 6.0 | 1/3 | 34.8s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 7.0 | 7.0 | 1/3 | 37.7s |
| #76 | Kimi K2.5 medium | Moonshot AI | 5.3 | 6.8 | 1/3 | 43.2s |
| #12 | Gemini 3.1 Flash Lite Preview high | 7.7 | 8.6 | 2/3 | 46.7s | |
| #67 | MiniMax M3 medium | Minimax | 7.9 | 7.1 | 2/3 | 49.9s |
| #53 | Gemini 3.1 Flash Lite high | 5.7 | 7.3 | 1/3 | 50.8s | |
| #30 | Qwen3.5-27B medium | Qwen | 8.2 | 7.8 | 2/3 | 59.6s |
| #78 | Qwen3.6 27B medium | Qwen | 7.7 | 6.8 | 2/3 | 61.1s |