AI BENCHY
Advertise here

فئة AI BENCHY

ترتيب مجمّع

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في مجمّع، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

15

متوسط درجة مجمّع

6.3

أفضل نموذج

Gemini 3 Flash Preview 3.0
الترتيب النموذج الشركة درجة مجمّع النتيجة اختبارات صحيحة زمن الاستجابة (المتوسط)
#38 Grok 4.3 medium X AI 10.0 7.6 1/1 64.0s
#39 Qwen3.6 Flash medium Qwen 10.0 7.5 1/1 20.3s
#40 Gemini 3.1 Flash Lite Preview medium Google 10.0 7.5 1/1 14.9s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 9.8 7.5 1/1 43.9s
#42 GPT-5.2 medium OpenAI 10.0 7.5 1/1 14.1s
#43 MiMo-V2.5-Pro medium Xiaomi 10.0 7.5 1/1 53.4s
#44 Gemini 3.1 Flash Lite medium Google 10.0 7.5 1/1 10.9s
#45 GPT-5.4 Mini medium OpenAI 10.0 7.5 1/1 17.8s
#47 Grok Build 0.1 medium X AI 10.0 7.4 1/1 32.8s
#49 Qwen3.5-Flash medium Qwen 10.0 7.4 1/1 17.8s
#52 Claude Sonnet 4.6 medium Anthropic 10.0 7.4 1/1 46.4s
#53 Gemini 3.1 Flash Lite high Google 10.0 7.3 1/1 149.2s
#54 GPT-5 Mini medium OpenAI 10.0 7.3 1/1 88.2s
#55 GLM 5.1 medium Z.ai 9.5 7.3 1/1 43.1s
#56 MiMo-V2.5 medium Xiaomi 10.0 7.3 1/1 16.9s

أفضل النماذج حسب درجة مجمّع

درجة مجمّع مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)