AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #37 | Gemma 4 26B A4B medium | 9.6 | 7.6 | 1/1 | 73.5s | |
| #38 | Grok 4.3 medium | X AI | 10.0 | 7.6 | 1/1 | 64.0s |
| #39 | Qwen3.6 Flash medium | Qwen | 10.0 | 7.5 | 1/1 | 20.3s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 7.5 | 1/1 | 14.9s | |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 9.8 | 7.5 | 1/1 | 43.9s |
| #42 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 1/1 | 14.1s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 10.0 | 7.5 | 1/1 | 53.4s |
| #44 | Gemini 3.1 Flash Lite medium | 10.0 | 7.5 | 1/1 | 10.9s | |
| #45 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.5 | 1/1 | 17.8s |
| #47 | Grok Build 0.1 medium | X AI | 10.0 | 7.4 | 1/1 | 32.8s |
| #49 | Qwen3.5-Flash medium | Qwen | 10.0 | 7.4 | 1/1 | 17.8s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 7.4 | 1/1 | 46.4s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 1/1 | 149.2s | |
| #54 | GPT-5 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 88.2s |
| #55 | GLM 5.1 medium | Z.ai | 9.5 | 7.3 | 1/1 | 43.1s |