AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #124 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.5 | 0/1 | 3.38s |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.5 | 0/1 | 3.54s |
| #32 | Gemini 3.5 Flash minimal | 3.0 | 7.7 | 0/1 | 3.56s | |
| #48 | Gemini 3 Flash Preview none | 4.7 | 7.4 | 0/1 | 3.56s | |
| #136 | Elephant Alpha medium | Openrouter | 3.0 | 5.1 | 0/1 | 3.70s |
| #137 | Elephant Alpha none | Openrouter | 3.0 | 5.1 | 0/1 | 3.81s |
| #148 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.7 | 0/1 | 3.84s |
| #128 | Qwen3.6 Flash none | Qwen | 3.0 | 5.4 | 0/1 | 4.22s |
| #150 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.6 | 0/1 | 4.28s |
| #145 | Laguna M.1 none | Poolside | 3.0 | 4.8 | 0/1 | 4.32s |
| #97 | Gemini 2.5 Flash none | 3.0 | 6.2 | 0/1 | 4.39s | |
| #61 | Gemini 3.1 Flash Lite low | 3.0 | 7.2 | 0/1 | 4.48s | |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 3.0 | 6.0 | 0/1 | 4.79s |
| #134 | GLM 5 Turbo none | Z.ai | 3.0 | 5.2 | 0/1 | 4.89s |
| #98 | GLM 5 none | Z.ai | 3.0 | 6.1 | 0/1 | 4.98s |