নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: gpt-oss-120b

সারাংশ

Seed-2.0-Lite vs gpt-oss-120b benchmark তুলনা: gpt-oss-120b average score-এ এগিয়ে: 6.1 vs 5.8. gpt-oss-120b-এর benchmark খরচ কম: $0.013 vs $0.019. Seed-2.0-Lite দ্রুত: 2.49s vs 22.28s, pass rates 46.0% vs 52.4%.

প্রস্তাবিত মডেল: Seed-2.0-Lite - Its score stays close to the best score here (5.8 vs 6.1), while responding about 9.0x faster than gpt-oss-120b.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite none প্রকাশ: 2026-02-14 gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য
স্কোর 5.8 6.1
র‍্যাঙ্ক #111 #100
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 46.0% 52.4%
অস্থির টেস্ট 4 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.228 0.141
মোট খরচ $0.019 $0.013
ইনপুট মূল্য $0.250 / 1M $0.039 / 1M
আউটপুট মূল্য $2.000 / 1M $0.180 / 1M
মোট ইনপুট টোকেন 46,573 39,084
আউটপুট টোকেন 3,259 20,013
রিজনিং টোকেন 0 50,233
প্রতিক্রিয়া সময় (গড়) 2.49s 22.28s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.70s 68.16s
প্রতিক্রিয়া সময় (মোট) 52.26s 311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none
Cost
$0.005
Time
83.8s
Tokens
2,311 tok

#100 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 894 709 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.6 10.0 33.3% 0 2.83s 8,215 410 0
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 16,215 498 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 8,538 246 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 939 17 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 570 294 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 810 73 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.3 7.2 44.4% 1 2.78s 858 709 0
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 9,270 292 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 1.96s 264 11 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

দ্রুত তুলনা

তুলনার জুটি বদলান