AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #7 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.6 | 1/1 | 19.6s |
| #35 | MiMo-V2-Omni medium | Xiaomi | 10.0 | 7.7 | 1/1 | 19.3s |
| #76 | Kimi K2.5 none | Moonshot AI | 2.8 | 5.5 | 0/1 | 19.2s |
| #4 | Claude Opus 4.7 none | Anthropic | 9.5 | 9.2 | 1/1 | 18.3s |
| #44 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.3 | 1/1 | 17.8s |
| #32 | Qwen3.5-Flash medium | Qwen | 10.0 | 7.8 | 1/1 | 17.8s |
| #47 | Grok 4.20 medium | X AI | 10.0 | 7.0 | 1/1 | 17.4s |
| #72 | Hunter Alpha none | OpenRouter | 3.0 | 5.7 | 0/1 | 15.2s |
| #31 | GLM 5V Turbo medium | Z.ai | 6.9 | 7.8 | 0/1 | 15.1s |
| #17 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 8.2 | 1/1 | 14.9s | |
| #40 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 1/1 | 14.1s |
| #18 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.1 | 1/1 | 13.9s |
| #36 | GPT-5.3 Chat none | OpenAI | 10.0 | 7.7 | 1/1 | 12.0s |
| #22 | Gemini 3.1 Flash Lite Preview low | 3.0 | 8.1 | 0/1 | 11.9s | |
| #12 | Gemini 3 PRO Preview medium | 3.0 | 8.4 | 0/1 | 10.4s |