التنقل
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 5.1

الملخص

مقارنة benchmark بين Claude Sonnet 4.6 و GLM 5.1: يتقدم Claude Sonnet 4.6 في متوسط النتيجة بـ 7.3 مقابل 7.1. لدى GLM 5.1 تكلفة benchmark أقل عند $0.292 مقابل $0.316. Claude Sonnet 4.6 أسرع عند 5.04s مقابل 33.67s، مع معدلات نجاح 55.6% مقابل 68.3%.

النموذج الموصى به: Claude Sonnet 4.6 - It has the best score here (7.3), while responding about 6.7x faster than GLM 5.1.

تم إنشاء نتائج المعايير من مجموعات اختبارات AI BENCHY في: 2026-06-12

المقياس Claude Sonnet 4.6 Claude Sonnet 4.6 none الإصدار: 2026-02-17 GLM 5.1 GLM 5.1 medium الإصدار: 2026-04-07
النتيجة 7.3 7.1
الترتيب #56 #64
الموثوقية 10.0 6.7
الاتساق 9.7 8.3
اختبارات صحيحة
معدل النجاح لكل محاولة 55.6% 68.3%
اختبارات غير مستقرة 1 4
إجمالي مرات التشغيل 63 63
التكلفة لكل نتيجة 2.870 2.496
إجمالي التكلفة $0.316 $0.292
سعر الإدخال $3.000 / 1M $0.980 / 1M
سعر الإخراج $15.000 / 1M $3.080 / 1M
إجمالي رموز الإدخال 57,886 32,995
رموز الإخراج 9,465 11,655
رموز الاستدلال 0 75,421
زمن الاستجابة (المتوسط) 5.04s 33.67s
زمن الاستجابة (الحد الأقصى) 23.84s 172.60s
زمن الاستجابة (الإجمالي) 70.60s 673.41s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#64 GLM 5.1

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

أفضل النماذج حسب الدرجة

الدرجة مقابل التكلفة الإجمالية

زمن الاستجابة (المتوسط)

النتيجة vs زمن الاستجابة (المتوسط)

إجمالي رموز الإخراج

النتيجة vs إجمالي رموز الإخراج

تفصيل الفئات

حيل مضادة للذكاء الاصطناعي النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
البرمجة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
مجمّع النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
تحليل البيانات واستخراجها النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
خاص بالمجال النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
الذكاء العام النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
اتباع التعليمات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
حل الألغاز النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
استدعاء الأدوات النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
معلومات عامة النتيجة الاتساق معدل النجاح لكل محاولة اختبارات غير مستقرة اختبارات صحيحة زمن الاستجابة (المتوسط) رموز الإدخال رموز الإخراج رموز الاستدلال
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

مقارنة سريعة

تبديل زوج المقارنة