AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #15 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.4 | 1/1 | 19.6s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 1/1 | 19.3s |
| #135 | Kimi K2.5 none | Moonshot AI | 2.8 | 5.2 | 0/1 | 19.2s |
| #8 | Claude Opus 4.7 none | Anthropic | 9.5 | 8.9 | 1/1 | 18.3s |
| #45 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.5 | 1/1 | 17.8s |
| #49 | Qwen3.5-Flash medium | Qwen | 10.0 | 7.4 | 1/1 | 17.8s |
| #68 | Claude Opus 4.8 none | Anthropic | 9.5 | 7.0 | 1/1 | 17.7s |
| #65 | Grok 4.20 medium | X AI | 10.0 | 7.1 | 1/1 | 17.4s |
| #56 | MiMo-V2.5 medium | Xiaomi | 10.0 | 7.3 | 1/1 | 16.9s |
| #141 | Nemotron 3 Super none | NVIDIA | 3.0 | 4.9 | 0/1 | 16.4s |
| #107 | Laguna Xs.2 medium | Poolside | 3.0 | 5.8 | 0/1 | 15.9s |
| #116 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 15.2s |
| #59 | GLM 5V Turbo medium | Z.ai | 6.9 | 7.2 | 0/1 | 15.1s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 7.5 | 1/1 | 14.9s | |
| #42 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 1/1 | 14.1s |