فئة AI BENCHY
ترتيب الذكاء العام
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في الذكاء العام، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: المقياس ↑.
| الترتيب | النموذج | الشركة | درجة الذكاء العام | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #47 | Grok Build 0.1 medium | X AI | 4.4 | 7.4 | 0/1 | 18.4s |
| #125 | GPT-5.4 none | OpenAI | 4.4 | 5.5 | 0/1 | 1.78s |
| #143 | MiMo-V2.5 none | Xiaomi | 4.4 | 4.9 | 0/1 | 6.86s |
| #154 | Qwen3.5-9B none | Qwen | 4.4 | 4.6 | 0/1 | 552ms |
| #157 | Grok 4.1 Fast none | X AI | 4.4 | 4.4 | 0/1 | 1.08s |
| #45 | GPT-5.4 Mini medium | OpenAI | 4.5 | 7.5 | 0/1 | 3.72s |
| #54 | GPT-5 Mini medium | OpenAI | 4.5 | 7.3 | 0/1 | 13.5s |
| #70 | GPT-5.4 Nano medium | OpenAI | 4.5 | 7.0 | 0/1 | 4.15s |
| #151 | Trinity Large Preview none | Arcee AI | 4.5 | 4.6 | 0/1 | 873ms |
| #15 | GPT-5.3-Codex medium | OpenAI | 4.6 | 8.4 | 0/1 | 4.87s |
| #63 | GPT-5.3 Chat none | OpenAI | 4.6 | 7.2 | 0/1 | 1.99s |
| #109 | GLM 5V Turbo none | Z.ai | 4.6 | 5.8 | 0/1 | 2.22s |
| #141 | Nemotron 3 Super none | NVIDIA | 4.6 | 4.9 | 0/1 | 950ms |
| #152 | MiMo-V2-Flash none | Xiaomi | 4.6 | 4.6 | 0/1 | 1.67s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 4.7 | 7.9 | 0/1 | 79.9s |