AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #74 | Qwen3.6 Max Preview none | Qwen | 3.0 | 6.9 | 0/1 | 20.5s |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 1/1 | 20.6s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 1/1 | 20.9s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 1/1 | 21.4s |
| #121 | Owl Alpha none | Openrouter | 3.0 | 5.5 | 0/1 | 21.7s |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 1/1 | 22.4s | |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 1/1 | 22.4s | |
| #159 | Ling-2.6-1T none | Inclusionai | 3.0 | 4.3 | 0/1 | 23.5s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 9.5 | 6.8 | 1/1 | 23.8s |
| #70 | GPT-5.4 Nano medium | OpenAI | 9.8 | 7.0 | 1/1 | 24.1s |
| #132 | Mistral Small 4 medium | Mistral | 3.0 | 5.3 | 0/1 | 25.3s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 9.5 | 5.7 | 1/1 | 25.5s |
| #80 | Mimo V2 Omni medium | Xiaomi | 10.0 | 6.7 | 1/1 | 25.9s |
| #28 | Gemini 2.5 Flash medium | 10.0 | 7.8 | 1/1 | 28.4s | |
| #17 | GLM 5 medium | Z.ai | 10.0 | 8.3 | 1/1 | 29.0s |