نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs ByteDance Seed: Seed-2.0-Lite

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-29

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 none اجرا: 2026-02-17 Seed-2.0-Lite Seed-2.0-Lite medium اجرا: 2026-02-14
اسکور 7.4 8.6
درجہ #54 #10
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 9.6 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 64.8% 83.3%
غیر مستحکم ٹیسٹ 1 3
کل رنز 54 54
فی نتیجہ لاگت 2.376 0.926
کل لاگت $0.262 $0.121
?? ?? ???? $3.000 / 1M $0.250 / 1M
??? ?? ???? $15.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 7,433 3,257
ریزننگ ٹوکنز 0 52,042
ردِعمل کا وقت (اوسط) 4.98s 30.37s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.84s 168.71s
ردِعمل کا وقت (کل) 54.83s 546.72s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں