AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #19 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.2 | 1/1 | 37.7s |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 1/1 | 37.6s |
| #156 | Hy3 preview none | Tencent | 3.0 | 4.4 | 0/1 | 35.8s |
| #138 | Ling-2.6-flash none | Inclusionai | 3.0 | 5.0 | 0/1 | 35.3s |
| #26 | Qwen3.6 Plus medium | Qwen | 10.0 | 7.9 | 1/1 | 35.0s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 6.3 | 1/1 | 35.0s |
| #47 | Grok Build 0.1 medium | X AI | 10.0 | 7.4 | 1/1 | 32.8s |
| #112 | GLM 5.1 none | Z.ai | 2.8 | 5.7 | 0/1 | 32.6s |
| #99 | gpt-oss-120b medium | OpenAI | 10.0 | 6.1 | 1/1 | 31.2s |
| #102 | Gemma 4 26B A4B none | 3.0 | 6.0 | 0/1 | 30.5s | |
| #79 | Hunter Alpha medium | OpenRouter | 4.7 | 6.7 | 0/1 | 30.5s |
| #62 | Step 3.5 Flash medium | Stepfun | 10.0 | 7.2 | 1/1 | 29.6s |
| #88 | Qwen3.7 Plus none | Qwen | 10.0 | 6.4 | 1/1 | 29.4s |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 1/1 | 29.0s |
| #28 | Gemini 2.5 Flash medium | 10.0 | 7.8 | 1/1 | 28.4s |