AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #15 | Gemini 2.5 Flash medium | 10.0 | 8.2 | 1/1 | 28.4s | |
| #13 | GLM 5 medium | Z.ai | 10.0 | 8.4 | 1/1 | 29.0s |
| #30 | Step 3.5 Flash medium | Stepfun | 10.0 | 7.9 | 1/1 | 29.6s |
| #50 | Hunter Alpha medium | OpenRouter | 4.7 | 6.7 | 0/1 | 30.5s |
| #60 | Gemma 4 26B A4B none | 3.0 | 6.2 | 0/1 | 30.5s | |
| #68 | gpt-oss-120b medium | OpenAI | 10.0 | 5.8 | 1/1 | 31.2s |
| #75 | GLM 5.1 none | Z.ai | 2.8 | 5.6 | 0/1 | 32.6s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 1/1 | 35.0s |
| #20 | Qwen3.6 Plus medium | Qwen | 10.0 | 8.1 | 1/1 | 35.0s |
| #52 | Grok 4.1 Fast medium | X AI | 10.0 | 6.7 | 1/1 | 37.6s |
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 1/1 | 37.7s |
| #2 | Gemini 3.1 Pro Preview medium | 9.5 | 9.6 | 1/1 | 40.6s | |
| #34 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.7 | 1/1 | 41.0s |
| #80 | MiniMax M2.7 medium | Minimax | 4.7 | 5.3 | 0/1 | 41.0s |
| #33 | GLM 5.1 medium | Z.ai | 9.5 | 7.8 | 1/1 | 43.1s |