AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #23 | MiMo-V2-Pro medium | Xiaomi | 4.7 | 8.1 | 0/1 | 64.7s |
| #71 | MiniMax M2.5 medium | Minimax | 4.5 | 5.7 | 0/1 | 60.4s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 10.0 | 1/1 | 50.2s | |
| #63 | Qwen3.5-35B-A3B none | Qwen | 3.0 | 6.1 | 0/1 | 47.4s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 8.5 | 1/1 | 46.8s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 1/1 | 46.4s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 3.0 | 5.7 | 0/1 | 46.0s |
| #87 | Qwen3 Coder Next none | Qwen | 3.0 | 5.1 | 0/1 | 45.1s |
| #33 | GLM 5.1 medium | Z.ai | 9.5 | 7.8 | 1/1 | 43.1s |
| #80 | MiniMax M2.7 medium | Minimax | 4.7 | 5.3 | 0/1 | 41.0s |
| #34 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.7 | 1/1 | 41.0s |
| #2 | Gemini 3.1 Pro Preview medium | 9.5 | 9.6 | 1/1 | 40.6s | |
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 1/1 | 37.7s |
| #52 | Grok 4.1 Fast medium | X AI | 10.0 | 6.7 | 1/1 | 37.6s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 35.0s |