نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs StepFun: Step 3.7 Flash

خلاصہ

Claude Sonnet 4.6 vs Step 3.7 Flash benchmark موازنہ: Claude Sonnet 4.6 average score میں آگے ہے: 7.8 vs 7.1. Step 3.7 Flash کی benchmark لاگت کم ہے: $1.148 vs $1.418. Claude Sonnet 4.6 تیز ہے: 17.06s vs 64.46s، pass rates 65.1% vs 63.5%.

تجویز کردہ ماڈل: Claude Sonnet 4.6 - It has the best score here (7.8), while responding about 3.8x faster than Step 3.7 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 medium اجرا: 2026-02-17 Step 3.7 Flash Step 3.7 Flash high اجرا: 2026-05-29
اسکور 7.8 7.1
درجہ #32 #65
اعتماد پذیری 10.0 10.0
تسلسل 9.1 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 65.1% 63.5%
غیر مستحکم ٹیسٹ 2 4
کل رنز 63 63
فی نتیجہ لاگت 10.904 10.434
کل لاگت $1.418 $1.148
ان پٹ قیمت $3.000 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $1.150 / 1M
کل ان پٹ ٹوکنز 49,112 38,391
آؤٹ پٹ ٹوکنز 54,703 991,355
ریزننگ ٹوکنز 29,970 0
ردِعمل کا وقت (اوسط) 17.06s 64.46s
ردِعمل کا وقت (زیادہ سے زیادہ) 46.35s 364.99s
ردِعمل کا وقت (کل) 221.83s 1353.57s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium
غلط SVG
لاگت
$0.000
وقت
300.0s
ٹوکنز
0 tok

#65 Step 3.7 Flash

high
لاگت
$0.007
وقت
63.6s
ٹوکنز
6,030 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 5.7 6.6 44.4% 1 33.29s 6,995 16,089 3,686
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں