نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

خلاصہ

Seed-2.0-Lite vs GLM 5 benchmark موازنہ: GLM 5 average score میں آگے ہے: 8.6 vs 8.5. Seed-2.0-Lite کی benchmark لاگت کم ہے: $0.175 vs $0.228. GLM 5 تیز ہے: 33.54s vs 47.07s، pass rates 76.2% vs 82.5%.

تجویز کردہ ماڈل: GLM 5 - It has the strongest score in this comparison (8.6) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Seed-2.0-Lite Seed-2.0-Lite medium اجرا: 2026-02-14 GLM 5 GLM 5 medium اجرا: 2026-02-12
اسکور 8.5 8.6
درجہ #18 #15
اعتماد پذیری 10.0 10.0
تسلسل 9.0 8.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 76.2% 82.5%
غیر مستحکم ٹیسٹ 3 4
کل رنز 63 63
فی نتیجہ لاگت 1.250 1.668
کل لاگت $0.175 $0.228
ان پٹ قیمت $0.250 / 1M $0.600 / 1M
آؤٹ پٹ قیمت $2.000 / 1M $1.920 / 1M
کل ان پٹ ٹوکنز 46,740 35,224
آؤٹ پٹ ٹوکنز 3,230 21,570
ریزننگ ٹوکنز 78,406 102,996
ردِعمل کا وقت (اوسط) 47.07s 33.54s
ردِعمل کا وقت (زیادہ سے زیادہ) 254.92s 99.85s
ردِعمل کا وقت (کل) 988.37s 435.99s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium
لاگت
$0.005
وقت
86.7s
ٹوکنز
2,354 tok

#15 GLM 5

medium
لاگت
$0.005
وقت
20.7s
ٹوکنز
2,068 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں