AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #54 | Mercury 2 medium | Inception | 10.0 | 6.5 | 1/1 | 3.28s |
| #95 | Grok 4.1 Fast none | X AI | 3.0 | 4.5 | 0/1 | 3.33s |
| #69 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.8 | 0/1 | 3.38s |
| #21 | Gemini 3 Flash Preview none | 4.7 | 8.1 | 0/1 | 3.56s | |
| #81 | Elephant medium | Openrouter | 3.0 | 5.2 | 0/1 | 3.70s |
| #85 | Elephant none | Openrouter | 3.0 | 5.2 | 0/1 | 3.81s |
| #96 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.5 | 0/1 | 3.84s |
| #92 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.7 | 0/1 | 4.28s |
| #62 | Gemini 2.5 Flash none | 3.0 | 6.2 | 0/1 | 4.39s | |
| #77 | GLM 5 Turbo none | Z.ai | 3.0 | 5.5 | 0/1 | 4.89s |
| #53 | GLM 5 none | Z.ai | 3.0 | 6.6 | 0/1 | 4.98s |
| #90 | Qwen3.5-9B none | Qwen | 3.0 | 4.8 | 0/1 | 5.91s |
| #82 | Grok 4.20 none | X AI | 3.0 | 5.2 | 0/1 | 6.04s |
| #59 | Qwen3.5-Flash none | Qwen | 3.0 | 6.2 | 0/1 | 6.22s |
| #79 | Grok 4.20 Beta none | X AI | 3.0 | 5.3 | 0/1 | 6.48s |