نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs DeepSeek: DeepSeek V4 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 DeepSeek V4 Flash DeepSeek V4 Flash high اجرا: 2026-04-24
اسکور 7.6 7.8
درجہ #43 #35
تسلسل 9.1 7.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.4% 79.6%
غیر مستحکم ٹیسٹ 2 5
کل رنز 54 52
فی نتیجہ لاگت 12.047 0.189
کل لاگت $1.446 $0.021
?? ?? ???? $5.000 / 1M $0.140 / 1M
??? ?? ???? $25.000 / 1M $0.280 / 1M
آؤٹ پٹ ٹوکنز 29,829 1,757
ریزننگ ٹوکنز 18,938 55,907
ردِعمل کا وقت (اوسط) 21.08s 47.47s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 255.28s
ردِعمل کا وقت (کل) 231.84s 854.45s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
DeepSeek V4 Flash 4.1 4.4 44.5% 2 112.69s 19 24,857
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں