نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.5

خلاصہ

Seed-2.0-Lite vs GPT-5.5 benchmark موازنہ: GPT-5.5 average score میں آگے ہے: 9.0 vs 8.2. Seed-2.0-Lite کی benchmark لاگت کم ہے: $0.175 vs $0.907. GPT-5.5 تیز ہے: 9.76s vs 47.07s، pass rates 76.2% vs 85.7%.

تجویز کردہ ماڈل: GPT-5.5 - It has the best score here (9.0), while responding about 4.8x faster than Seed-2.0-Lite.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-10

میٹرک Seed-2.0-Lite Seed-2.0-Lite medium اجرا: 2026-02-14 GPT-5.5 GPT-5.5 low اجرا: 2026-04-24
اسکور 8.2 9.0
درجہ #20 #6
اعتماد پذیری 10.0 10.0
تسلسل 9.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 76.2% 85.7%
غیر مستحکم ٹیسٹ 3 0
کل رنز 63 63
فی نتیجہ لاگت 1.250 5.035
کل لاگت $0.175 $0.907
ان پٹ قیمت $0.250 / 1M $5.000 / 1M
آؤٹ پٹ قیمت $2.000 / 1M $30.000 / 1M
کل ان پٹ ٹوکنز 46,740 34,209
آؤٹ پٹ ٹوکنز 3,230 2,046
ریزننگ ٹوکنز 78,406 22,460
ردِعمل کا وقت (اوسط) 47.07s 9.76s
ردِعمل کا وقت (زیادہ سے زیادہ) 254.92s 56.19s
ردِعمل کا وقت (کل) 988.37s 204.92s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

#6 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں