AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 3.0 | 6.0 | 0/1 | 4.79s |
| #61 | Gemini 3.1 Flash Lite low | 3.0 | 7.2 | 0/1 | 4.48s | |
| #97 | Gemini 2.5 Flash none | 3.0 | 6.2 | 0/1 | 4.39s | |
| #145 | Laguna M.1 none | Poolside | 3.0 | 4.8 | 0/1 | 4.32s |
| #150 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.6 | 0/1 | 4.28s |
| #128 | Qwen3.6 Flash none | Qwen | 3.0 | 5.4 | 0/1 | 4.22s |
| #148 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.7 | 0/1 | 3.84s |
| #137 | Elephant Alpha none | Openrouter | 3.0 | 5.1 | 0/1 | 3.81s |
| #136 | Elephant Alpha medium | Openrouter | 3.0 | 5.1 | 0/1 | 3.70s |
| #48 | Gemini 3 Flash Preview none | 4.7 | 7.4 | 0/1 | 3.56s | |
| #32 | Gemini 3.5 Flash minimal | 3.0 | 7.7 | 0/1 | 3.56s | |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 3.0 | 5.5 | 0/1 | 3.54s |
| #124 | Kimi K2.6 none | Moonshot AI | 3.0 | 5.5 | 0/1 | 3.38s |
| #157 | Grok 4.1 Fast none | X AI | 3.0 | 4.4 | 0/1 | 3.33s |
| #81 | Mercury 2 medium | Inception | 10.0 | 6.6 | 1/1 | 3.28s |