التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

النماذج المقارنة

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-05-10

المقياس Gemma 4 31B Gemma 4 31B medium الإصدار: 2026-04-02 متاح مجانًا Gemini 3 PRO Preview Gemini 3 PRO Preview medium الإصدار: 2025-11-18 GLM 5 Turbo GLM 5 Turbo medium الإصدار: 2026-03-15
النتيجة 8.2 8.4 8.1
الترتيب #14 #10 #20
الموثوقية 6.7 غير متاح 6.7
الاتساق 9.6 10.0 8.4
اختبارات صحيحة
معدل النجاح لكل محاولة 77.2% 77.8% 77.2%
اختبارات غير مستقرة 1 0 4
إجمالي مرات التشغيل 57 57 57
التكلفة لكل نتيجة 0.158 1.406 1.438
إجمالي التكلفة $0.023 $0.197 $0.187
??? ??????? $0.130 / 1M $0.000 / 1M $1.200 / 1M
??? ??????? $0.380 / 1M $0.000 / 1M $4.000 / 1M
رموز الإخراج 14,426 1,508 12,217
رموز الاستدلال 37,964 10,084 40,252
زمن الاستجابة (المتوسط) 28.72s 9.06s 18.85s
زمن الاستجابة (الحد الأقصى) 90.14s 26.24s 194.23s
زمن الاستجابة (الإجمالي) 488.27s 90.58s 358.15s

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 14.99s 149 1,485
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 4.7 1.6 66.7% 1 70.97s 3,166 5,449
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 0ms 0 0
GLM 5 Turbo 10.0 10.0 100.0% 0 12.26s 332 3,301
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 10.37s 351 952
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 10.84s 279 3,156
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Gemini 3 PRO Preview 5.3 10.0 33.3% 0 7.01s 15 1,195
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 9.34s 78 374
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Gemini 3 PRO Preview 9.8 10.0 100.0% 0 3.26s 69 754
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 9.9 10.0 100.0% 0 27.63s 1,797 5,596
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
GLM 5 Turbo 8.7 7.9 77.8% 1 5.44s 315 2,702
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 11.96s 324 971
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإخراج رموز الاستدلال
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 1,692 10,014
Gemini 3 PRO Preview 0.0 0.0 0.0% 0 0ms 0 0
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 20 1,319

مقارنة سريعة

تبديل زوج المقارنة