নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.2 Chat

সারাংশ

Seed-2.0-Lite vs GPT-5.2 Chat benchmark তুলনা: Seed-2.0-Lite average score-এ এগিয়ে: 8.2 vs 7.9. Seed-2.0-Lite-এর benchmark খরচ কম: $0.175 vs $0.393. GPT-5.2 Chat দ্রুত: 7.13s vs 47.07s, pass rates 76.2% vs 74.6%.

প্রস্তাবিত মডেল: GPT-5.2 Chat - Its score stays close to the best score here (7.9 vs 8.2), while responding about 6.6x faster than Seed-2.0-Lite.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক Seed-2.0-Lite Seed-2.0-Lite medium প্রকাশ: 2026-02-14 GPT-5.2 Chat GPT-5.2 Chat none প্রকাশ: 2025-12-11
স্কোর 8.2 7.9
র‍্যাঙ্ক #20 #25
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.0 8.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.2% 74.6%
অস্থির টেস্ট 3 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 1.250 2.803
মোট খরচ $0.175 $0.393
ইনপুট মূল্য $0.250 / 1M $1.750 / 1M
আউটপুট মূল্য $2.000 / 1M $14.000 / 1M
মোট ইনপুট টোকেন 46,740 34,212
আউটপুট টোকেন 3,230 23,744
রিজনিং টোকেন 78,406 0
প্রতিক্রিয়া সময় (গড়) 47.07s 7.13s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 254.92s 38.52s
প্রতিক্রিয়া সময় (মোট) 988.37s 149.69s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Seed-2.0-Lite

medium
Cost
$0.005
Time
86.7s
Tokens
2,354 tok

#25 GPT-5.2 Chat

none
Cost
$0.010
Time
15.3s
Tokens
797 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0

দ্রুত তুলনা

তুলনার জুটি বদলান