نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Cobuddy

خلاصہ

Claude Sonnet 5 vs Cobuddy benchmark موازنہ: Claude Sonnet 5 average score میں آگے ہے: 5.7 vs 4.9. Cobuddy کی benchmark لاگت کم ہے: $0.000 vs $0.287. Claude Sonnet 5 تیز ہے: 4.74s vs 39.90s، pass rates 42.9% vs 47.6%.

تجویز کردہ ماڈل: Claude Sonnet 5 - It has the best score here (5.7), while responding about 8.4x faster than Cobuddy.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-30

میٹرک Claude Sonnet 5 Claude Sonnet 5 none اجرا: 2026-06-30 Cobuddy Cobuddy medium اجرا: 2026-05-06
اسکور 5.7 4.9
درجہ #117 #143
اعتماد پذیری 10.0 10.0
تسلسل 8.6 7.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 42.9% 47.6%
غیر مستحکم ٹیسٹ 4 6
کل رنز 63 63
فی نتیجہ لاگت 4.098 0.000
کل لاگت $0.287 $0.000
ان پٹ قیمت $2.000 / 1M $0.000 / 1M
آؤٹ پٹ قیمت $10.000 / 1M $0.000 / 1M
کل ان پٹ ٹوکنز 76,797 37,449
آؤٹ پٹ ٹوکنز 13,325 1,677
ریزننگ ٹوکنز 0 116,703
ردِعمل کا وقت (اوسط) 4.74s 39.90s
ردِعمل کا وقت (زیادہ سے زیادہ) 29.46s 309.02s
ردِعمل کا وقت (کل) 99.46s 797.98s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
لاگت
$0.061
وقت
53.7s
ٹوکنز
6,172 tok

#143 Cobuddy

medium
No endpoints found for baidu/cobuddy:free.
لاگت
$0.000
وقت
0.1s
ٹوکنز
0 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں