AI BENCHY श्रेणी
संयुक्त रैंकिंग
देखें कि संयुक्त में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | संयुक्त स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #67 | Qwen3.5-27B none | Qwen | 2.8 | 5.9 | 0/1 | 9.39s |
| #28 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 1/1 | 9.12s |
| #78 | Trinity Large Preview none | Arcee AI | 3.0 | 5.3 | 0/1 | 8.91s |
| #89 | GPT-4o-mini none | OpenAI | 3.0 | 4.9 | 0/1 | 7.58s |
| #49 | Qwen3.5 Plus 2026-02-15 none | Qwen | 3.0 | 6.8 | 0/1 | 6.65s |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 6.2 | 0/1 | 6.59s |
| #65 | MiMo-V2-Pro none | Xiaomi | 3.0 | 6.0 | 0/1 | 6.58s |
| #58 | GLM 5V Turbo none | Z.ai | 3.0 | 6.2 | 0/1 | 6.51s |
| #79 | Grok 4.20 Beta none | X AI | 3.0 | 5.3 | 0/1 | 6.48s |
| #59 | Qwen3.5-Flash none | Qwen | 3.0 | 6.2 | 0/1 | 6.22s |
| #82 | Grok 4.20 none | X AI | 3.0 | 5.2 | 0/1 | 6.04s |
| #90 | Qwen3.5-9B none | Qwen | 3.0 | 4.8 | 0/1 | 5.91s |
| #53 | GLM 5 none | Z.ai | 3.0 | 6.6 | 0/1 | 4.98s |
| #77 | GLM 5 Turbo none | Z.ai | 3.0 | 5.5 | 0/1 | 4.89s |
| #62 | Gemini 2.5 Flash none | 3.0 | 6.2 | 0/1 | 4.39s |