فئة AI BENCHY
ترتيب تحليل البيانات واستخراجها
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في تحليل البيانات واستخراجها، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.
| الترتيب | النموذج | الشركة | درجة تحليل البيانات واستخراجها | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.6 | 2/2 | 5.54s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 10.0 | 7.5 | 2/2 | 5.68s |
| #98 | GLM 5 none | Z.ai | 10.0 | 6.1 | 2/2 | 5.78s |
| #89 | Hy3 preview low | Tencent | 6.5 | 6.4 | 1/2 | 5.85s |
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 2/2 | 6.19s |
| #56 | MiMo-V2.5 medium | Xiaomi | 2.7 | 7.3 | 0/2 | 6.33s |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 2/2 | 6.43s | |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 2/2 | 6.63s |
| #126 | gpt-oss-120b none | OpenAI | 6.5 | 5.4 | 1/2 | 7.12s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 2/2 | 7.16s | |
| #69 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.0 | 2/2 | 7.37s |
| #129 | MiniMax M2.5 medium | Minimax | 4.6 | 5.3 | 0/2 | 7.48s |
| #4 | Gemini 3.1 Pro Preview medium | 10.0 | 9.4 | 2/2 | 7.72s | |
| #141 | Nemotron 3 Super none | NVIDIA | 10.0 | 4.9 | 2/2 | 7.92s |
| #20 | Gemini 3.5 Flash none | 6.5 | 8.1 | 1/2 | 8.10s |