نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Z.ai: GLM 5.2

خلاصہ

Claude Sonnet 5 vs GLM 5.2 benchmark موازنہ: Claude Sonnet 5 average score میں آگے ہے: 7.9 vs 7.1. GLM 5.2 کی benchmark لاگت کم ہے: $0.051 vs $0.550. GLM 5.2 تیز ہے: 6.34s vs 9.94s، pass rates 79.4% vs 60.3%.

تجویز کردہ ماڈل: GLM 5.2 - Its score stays close to the best score here (7.1 vs 7.9), while costing about 10.9x less than Claude Sonnet 5.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-30

میٹرک Claude Sonnet 5 Claude Sonnet 5 medium اجرا: 2026-06-30 GLM 5.2 GLM 5.2 none اجرا: 2026-06-17
اسکور 7.9 7.1
درجہ #30 #63
اعتماد پذیری 10.0 9.9
تسلسل 9.0 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.4% 60.3%
غیر مستحکم ٹیسٹ 3 1
کل رنز 63 63
فی نتیجہ لاگت 3.662 0.628
کل لاگت $0.550 $0.051
ان پٹ قیمت $2.000 / 1M $0.930 / 1M
آؤٹ پٹ قیمت $10.000 / 1M $3.000 / 1M
کل ان پٹ ٹوکنز 67,416 38,671
آؤٹ پٹ ٹوکنز 34,012 4,817
ریزننگ ٹوکنز 7,673 0
ردِعمل کا وقت (اوسط) 9.94s 6.34s
ردِعمل کا وقت (زیادہ سے زیادہ) 56.94s 20.69s
ردِعمل کا وقت (کل) 208.71s 133.19s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
لاگت
$0.007
وقت
6.4s
ٹوکنز
832 tok

#63 GLM 5.2

none
غلط SVG
لاگت
$0.033
وقت
87.7s
ٹوکنز
7,455 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
GLM 5.2 8.3 10.0 75.0% 0 3.70s 567 313 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
GLM 5.2 3.7 9.5 0.0% 0 7.55s 7,263 1,958 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
GLM 5.2 10.0 10.0 100.0% 0 20.69s 14,296 1,489 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
GLM 5.2 10.0 10.0 100.0% 0 7.17s 7,113 204 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
GLM 5.2 5.3 10.0 33.3% 0 6.50s 696 27 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
GLM 5.2 6.1 3.1 66.7% 1 4.42s 480 82 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
GLM 5.2 9.8 10.0 100.0% 0 3.84s 642 66 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
GLM 5.2 7.7 10.0 66.7% 0 3.31s 618 265 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
GLM 5.2 10.0 10.0 100.0% 0 15.76s 6,807 400 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
GLM 5.2 3.0 10.0 0.0% 0 3.41s 189 13 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں