نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V4 Pro

خلاصہ

Claude Sonnet 4.6 vs DeepSeek V4 Pro benchmark موازنہ: Claude Sonnet 4.6 average score میں آگے ہے: 7.8 vs 7.2. DeepSeek V4 Pro کی benchmark لاگت کم ہے: $0.034 vs $1.418. DeepSeek V4 Pro تیز ہے: 6.41s vs 17.06s، pass rates 65.1% vs 52.4%.

تجویز کردہ ماڈل: DeepSeek V4 Pro - Its score stays close to the best score here (7.2 vs 7.8), while costing about 42.6x less than Claude Sonnet 4.6.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-30

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 medium اجرا: 2026-02-17 DeepSeek V4 Pro DeepSeek V4 Pro none اجرا: 2026-04-24
اسکور 7.8 7.2
درجہ #32 #60
اعتماد پذیری 10.0 9.9
تسلسل 9.1 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 65.1% 52.4%
غیر مستحکم ٹیسٹ 2 3
کل رنز 63 63
فی نتیجہ لاگت 10.904 0.333
کل لاگت $1.418 $0.034
ان پٹ قیمت $3.000 / 1M $0.435 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $0.870 / 1M
کل ان پٹ ٹوکنز 49,112 53,558
آؤٹ پٹ ٹوکنز 54,703 11,424
ریزننگ ٹوکنز 29,970 0
ردِعمل کا وقت (اوسط) 17.06s 6.41s
ردِعمل کا وقت (زیادہ سے زیادہ) 46.35s 30.09s
ردِعمل کا وقت (کل) 221.83s 134.66s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 Claude Sonnet 4.6

medium
غلط SVG
لاگت
$0.000
وقت
300.0s
ٹوکنز
0 tok

#60 DeepSeek V4 Pro

none
غلط SVG
لاگت
$0.000
وقت
300.0s
ٹوکنز
0 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 789 1,046 1,093
DeepSeek V4 Pro 3.2 6.1 16.7% 2 4.02s 540 1,168 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 5.7 6.6 44.4% 1 33.29s 6,995 16,089 3,686
DeepSeek V4 Pro 5.6 10.0 33.3% 0 13.38s 7,275 5,500 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 18,351 5,871 3,962
DeepSeek V4 Pro 9.5 10.0 100.0% 0 23.74s 27,529 2,235 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 8,676 649 742
DeepSeek V4 Pro 10.0 10.0 100.0% 0 4.61s 7,568 200 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 471 25,790 16,919
DeepSeek V4 Pro 5.3 10.0 33.3% 0 3.72s 666 24 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 564 256 433
DeepSeek V4 Pro 5.0 10.0 0.0% 0 2.05s 471 126 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 792 318 552
DeepSeek V4 Pro 6.3 5.8 66.7% 1 4.12s 627 713 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 816 592 646
DeepSeek V4 Pro 10.0 10.0 100.0% 0 3.61s 594 442 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 11,454 655 351
DeepSeek V4 Pro 10.0 10.0 100.0% 0 7.40s 8,105 328 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 204 3,437 1,586
DeepSeek V4 Pro 3.0 10.0 0.0% 0 5.76s 183 688 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں