AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #80 | Mimo V2 Omni medium | Xiaomi | 10.0 | 6.7 | 1/1 | 25.9s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 9.5 | 5.7 | 1/1 | 25.5s |
| #132 | Mistral Small 4 medium | Mistral | 3.0 | 5.3 | 0/1 | 25.3s |
| #70 | GPT-5.4 Nano medium | OpenAI | 9.8 | 7.0 | 1/1 | 24.1s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 9.5 | 6.8 | 1/1 | 23.8s |
| #159 | Ling-2.6-1T none | Inclusionai | 3.0 | 4.3 | 0/1 | 23.5s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 1/1 | 22.4s | |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 1/1 | 22.4s | |
| #121 | Owl Alpha none | Openrouter | 3.0 | 5.5 | 0/1 | 21.7s |
| #11 | Claude Opus 4.7 medium | Anthropic | 10.0 | 8.7 | 1/1 | 21.4s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 1/1 | 20.9s |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 1/1 | 20.6s |
| #74 | Qwen3.6 Max Preview none | Qwen | 3.0 | 6.9 | 0/1 | 20.5s |
| #39 | Qwen3.6 Flash medium | Qwen | 10.0 | 7.5 | 1/1 | 20.3s |
| #5 | Qwen3.7 Max medium | Qwen | 10.0 | 9.1 | 1/1 | 19.6s |