AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #76 | Kimi K2.5 medium | Moonshot AI | 10.0 | 6.8 | 1/1 | 71.4s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 9.5 | 6.8 | 1/1 | 23.8s |
| #80 | Mimo V2 Omni medium | Xiaomi | 10.0 | 6.7 | 1/1 | 25.9s |
| #81 | Mercury 2 medium | Inception | 10.0 | 6.6 | 1/1 | 3.28s |
| #82 | Hy3 preview high | Tencent | 10.0 | 6.6 | 1/1 | 113.1s |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 1/1 | 37.6s |
| #88 | Qwen3.7 Plus none | Qwen | 10.0 | 6.4 | 1/1 | 29.4s |
| #89 | Hy3 preview low | Tencent | 10.0 | 6.4 | 1/1 | 78.7s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 6.3 | 1/1 | 35.0s |
| #94 | GPT-5 Nano medium | OpenAI | 10.0 | 6.3 | 1/1 | 66.0s |
| #99 | gpt-oss-120b medium | OpenAI | 10.0 | 6.1 | 1/1 | 31.2s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 10.0 | 6.0 | 1/1 | 65.0s |
| #105 | Nemotron 3 Super medium | NVIDIA | 10.0 | 5.8 | 1/1 | 87.8s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 9.5 | 5.7 | 1/1 | 25.5s |
| #16 | Gemini 3 Flash Preview low | 3.0 | 8.4 | 0/1 | 3.27s |