نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs OpenAI: gpt-oss-120b

خلاصہ

DeepSeek V4 Flash vs gpt-oss-120b benchmark موازنہ: gpt-oss-120b average score میں آگے ہے: 6.1 vs 5.0. DeepSeek V4 Flash کی benchmark لاگت کم ہے: $0.008 vs $0.013. gpt-oss-120b تیز ہے: 22.28s vs 26.75s، pass rates 30.2% vs 52.4%.

تجویز کردہ ماڈل: gpt-oss-120b - It has the strongest score in this comparison (6.1) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-04

میٹرک DeepSeek V4 Flash DeepSeek V4 Flash none اجرا: 2026-04-24 gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب
اسکور 5.0 6.1
درجہ #139 #99
اعتماد پذیری 10.0 10.0
تسلسل 8.9 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 30.2% 52.4%
غیر مستحکم ٹیسٹ 3 5
کل رنز 63 63
فی نتیجہ لاگت 0.203 0.141
کل لاگت $0.008 $0.013
ان پٹ قیمت $0.099 / 1M $0.039 / 1M
آؤٹ پٹ قیمت $0.197 / 1M $0.180 / 1M
کل ان پٹ ٹوکنز 50,127 39,084
آؤٹ پٹ ٹوکنز 13,710 20,013
ریزننگ ٹوکنز 0 50,233
ردِعمل کا وقت (اوسط) 26.75s 22.28s
ردِعمل کا وقت (زیادہ سے زیادہ) 111.96s 68.16s
ردِعمل کا وقت (کل) 561.82s 311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#139 DeepSeek V4 Flash

none
Cost
$0.004
Time
157.6s
Tokens
11,297 tok

#99 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 3.0 10.0 0.0% 0 20.18s 540 174 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 4.2 7.4 11.1% 1 17.13s 7,279 9,717 0
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 4.5 2.1 66.7% 1 111.96s 24,398 2,664 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 23.79s 7,290 195 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 5.3 10.0 33.3% 0 19.73s 666 18 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 4.2 9.9 0.0% 0 23.74s 471 67 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 6.5 10.0 50.0% 0 17.54s 627 321 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 3.1 7.3 11.1% 1 23.72s 594 207 0
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 77.93s 8,079 327 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 3.0 10.0 0.0% 0 3.07s 183 20 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں