AI BENCHY
Advertise here

فئة AI BENCHY

ترتيب البرمجة

اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في البرمجة، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.

النماذج المعروضة

15

متوسط درجة البرمجة

6.1

أفضل نموذج

Gemini 3.5 Flash 10.0
الترتيب النموذج الشركة درجة البرمجة النتيجة اختبارات صحيحة زمن الاستجابة (المتوسط)
#2 Gemini 3.5 Flash high Google 10.0 9.6 2/2 24.6s
#5 Qwen3.7 Max medium Qwen 10.0 9.0 2/2 23.0s
#7 Claude Opus 4.7 medium Anthropic 10.0 8.9 2/2 14.8s
#8 GPT-5.5 low OpenAI 10.0 8.9 2/2 14.4s
#10 Claude Opus 4.7 none Anthropic 10.0 8.9 1/1 2.84s
#14 Grok 4.20 Beta medium X AI 10.0 8.5 1/1 31.4s
#16 GPT-5.3-Codex medium OpenAI 10.0 8.3 2/2 18.5s
#18 GLM 5 medium Z.ai 10.0 8.2 2/2 89.5s
#19 Hy3 preview medium Tencent 10.0 8.1 1/1 31.4s
#22 Hy3 preview high Tencent 10.0 8.1 1/1 99.8s
#39 Hy3 preview low Tencent 10.0 7.7 1/1 27.9s
#51 Gemini 3.1 Flash Lite high Google 10.0 7.5 1/1 137.6s
#60 GPT-5.2 medium OpenAI 10.0 7.3 2/2 23.2s
#64 Ring-2.6-1T medium Inclusionai 10.0 7.2 1/1 59.6s
#65 Ring-2.6-1T none Inclusionai 10.0 7.2 1/1 143.8s

أفضل النماذج حسب درجة البرمجة

درجة البرمجة مقابل إجمالي التكلفة

أفضل النماذج حسب زمن الاستجابة (المتوسط)