AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #74 | GLM 4.7 Flash none | Z.ai | 3.0 | 5.6 | 0/1 | 3.22s |
| #75 | GLM 5.1 none | Z.ai | 2.8 | 5.6 | 0/1 | 32.6s |
| #76 | Kimi K2.5 none | Moonshot AI | 2.8 | 5.5 | 0/1 | 19.2s |
| #77 | GLM 5 Turbo none | Z.ai | 3.0 | 5.5 | 0/1 | 4.89s |
| #78 | Trinity Large Preview none | Arcee AI | 3.0 | 5.3 | 0/1 | 8.91s |
| #79 | Grok 4.20 Beta none | X AI | 3.0 | 5.3 | 0/1 | 6.48s |
| #80 | MiniMax M2.7 medium | Minimax | 4.7 | 5.3 | 0/1 | 41.0s |
| #81 | Elephant medium | Openrouter | 3.0 | 5.2 | 0/1 | 3.70s |
| #82 | Grok 4.20 none | X AI | 3.0 | 5.2 | 0/1 | 6.04s |
| #83 | Mistral Small 4 none | Mistral | 3.0 | 5.2 | 0/1 | 1.72s |
| #84 | gpt-oss-120b none | OpenAI | 3.0 | 5.2 | 0/1 | 0ms |
| #85 | Elephant none | Openrouter | 3.0 | 5.2 | 0/1 | 3.81s |
| #86 | GPT-5.4 Mini none | OpenAI | 3.0 | 5.1 | 0/1 | 2.52s |
| #87 | Qwen3 Coder Next none | Qwen | 3.0 | 5.1 | 0/1 | 45.1s |
| #88 | Nemotron 3 Super none | NVIDIA | 3.0 | 5.1 | 0/1 | 20.0s |