AI BENCHY Compare
Google: Gemini 3.1 Flash Lite Preview vs Z.ai: GLM 5
قارن:
تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-03-03
| المقياس | Google: Gemini 3.1 Flash Lite Preview none الإصدار: 2026-03-03 | Z.ai: GLM 5 medium الإصدار: 2026-02-12 |
|---|---|---|
| الترتيب | #10 | #13 |
| متوسط الدرجة | 7.70 | 7.29 |
| الاتساق | 9.54 | 8.18 |
| التكلفة لكل نتيجة | 0.116 | 1.196 |
| إجمالي التكلفة | $0.011 | $0.120 |
| اختبارات صحيحة | ||
| معدل النجاح لكل محاولة | 69.1% | 83.3% |
| اختبارات غير مستقرة | 1 | 3 |
| رموز الإخراج | 4,307 | 15,923 |
| رموز الاستدلال | 0 | 42,557 |
الدرجة مقابل التكلفة الإجمالية
تفصيل الفئات
| حيل مضادة للذكاء الاصطناعي | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 6.00 | 7.85 | 55.6% | 1 | 1,086 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 420 | 4,992 |
| تحليل البيانات واستخراجها | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 9.88 | 10.00 | 100.0% | 0 | 399 | 0 | |
| Z.ai: GLM 5 | 5.00 | 5.62 | 83.3% | 1 | 567 | 3,734 |
| خاص بالمجال | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 4.00 | 10.00 | 33.3% | 0 | 568 | 0 | |
| Z.ai: GLM 5 | 1.00 | 4.41 | 33.3% | 2 | 14,404 | 24,570 |
| اتباع التعليمات | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 9.00 | 10.00 | 50.0% | 0 | 574 | 0 | |
| Z.ai: GLM 5 | 9.50 | 9.99 | 100.0% | 0 | 140 | 2,740 |
| Puzzle Solving | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 898 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 159 | 5,527 |
| استدعاء الأدوات | النتيجة | الاتساق | معدل النجاح لكل محاولة | اختبارات غير مستقرة | اختبارات صحيحة | رموز الإخراج | رموز الاستدلال |
|---|---|---|---|---|---|---|---|
| Google: Gemini 3.1 Flash Lite Preview | 10.00 | 10.00 | 100.0% | 0 | 782 | 0 | |
| Z.ai: GLM 5 | 10.00 | 10.00 | 100.0% | 0 | 233 | 994 |
مقارنة سريعة
تبديل زوج المقارنة
GPT-5.3 ChatnonevsGLM 5mediumGemini 3 Flash PreviewnonevsGLM 5mediumGPT-5.2 ChatnonevsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsGPT-5.3-CodexmediumClaude Sonnet 4.6mediumvsGemini 3.1 Flash Lite PreviewnoneGemini 3.1 Flash Lite PreviewhighvsGLM 5mediumGemini 3.1 Flash Lite PreviewlowvsGLM 5mediumGemini 3.1 Flash Lite PreviewnonevsStep 3.5 Flashmediumمتاح مجانًاDeepSeek V3.2mediumvsGemini 3.1 Flash Lite PreviewnoneGemini 3.1 Flash Lite PreviewnonevsGPT-5.2mediumGemini 3.1 Flash Lite PreviewnonevsQwen3.5-27BmediumGemini 3.1 Flash Lite PreviewnonevsQwen3.5-122B-A10Bmedium