AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 10.0 | 7.5 | 1/1 | 53.4s |
| #92 | Laguna M.1 medium | Poolside | 3.0 | 6.4 | 0/1 | 53.1s |
| #117 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 5.6 | 0/1 | 47.4s |
| #119 | Cobuddy medium | Baidu | 3.0 | 5.6 | 0/1 | 47.4s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 7.9 | 1/1 | 46.8s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 7.4 | 1/1 | 46.4s |
| #33 | Hy3 preview medium | Tencent | 10.0 | 7.7 | 1/1 | 46.0s |
| #131 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.3 | 0/1 | 46.0s |
| #140 | Qwen3 Coder Next none | Qwen | 3.0 | 4.9 | 0/1 | 45.1s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 9.8 | 7.5 | 1/1 | 43.9s |
| #55 | GLM 5.1 medium | Z.ai | 9.5 | 7.3 | 1/1 | 43.1s |
| #130 | MiniMax M2.7 medium | Minimax | 4.7 | 5.3 | 0/1 | 41.0s |
| #60 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.2 | 1/1 | 41.0s |
| #4 | Gemini 3.1 Pro Preview medium | 9.5 | 9.4 | 1/1 | 40.6s | |
| #10 | Claude Opus 4.8 medium | Anthropic | 9.8 | 8.7 | 1/1 | 38.0s |