নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5 Mini

সারাংশ

Seed-2.0-Mini vs GPT-5 Mini benchmark তুলনা: GPT-5 Mini average score-এ এগিয়ে: 8.5 vs 7.4. Seed-2.0-Mini-এর benchmark খরচ কম: $0.044 vs $0.159. GPT-5 Mini দ্রুত: 23.64s vs 80.22s, pass rates 57.1% vs 63.5%.

প্রস্তাবিত মডেল: GPT-5 Mini - It has the best score here (8.5), while responding about 3.4x faster than Seed-2.0-Mini.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Seed-2.0-Mini Seed-2.0-Mini medium প্রকাশ: 2026-02-14 GPT-5 Mini GPT-5 Mini medium প্রকাশ: 2025-08-07
স্কোর 7.4 8.5
র‍্যাঙ্ক #51 #19
নির্ভরযোগ্যতা 6.7 10.0
ধারাবাহিকতা 9.3 9.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 57.1% 63.5%
অস্থির টেস্ট 2 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.397 1.319
মোট খরচ $0.044 $0.159
ইনপুট মূল্য $0.100 / 1M $0.250 / 1M
আউটপুট মূল্য $0.400 / 1M $2.000 / 1M
মোট ইনপুট টোকেন 41,904 37,100
আউটপুট টোকেন 2,555 6,801
রিজনিং টোকেন 95,974 67,690
প্রতিক্রিয়া সময় (গড়) 80.22s 23.64s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 262.83s 88.15s
প্রতিক্রিয়া সময় (মোট) 1363.72s 496.44s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Seed-2.0-Mini

medium
Cost
$0.002
Time
161.7s
Tokens
4,379 tok

#19 GPT-5 Mini

medium
Cost
$0.007
Time
42.9s
Tokens
3,432 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 791 360 9,520
GPT-5 Mini 7.1 7.6 66.7% 1 13.86s 606 1,715 6,378
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.5 9.8 33.3% 0 220.48s 3,823 464 34,964
GPT-5 Mini 10.0 10.0 100.0% 0 27.63s 7,302 658 17,152
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 16,533 404 29,806
GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 14,118 754 11,520
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 8,568 246 2,743
GPT-5 Mini 10.0 10.0 100.0% 0 12.58s 7,140 453 3,200
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0 0
GPT-5 Mini 3.6 7.2 22.2% 1 44.63s 515 293 14,016
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 585 213 4,210
GPT-5 Mini 4.5 10.0 0.0% 0 13.50s 477 349 1,856
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 840 69 2,050
GPT-5 Mini 10.0 10.0 100.0% 0 11.59s 660 310 3,968
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 8.2 7.2 88.9% 1 31.79s 903 527 5,667
GPT-5 Mini 5.6 9.8 33.3% 0 15.20s 642 1,622 6,144
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 9,585 222 5,235
GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 5,445 487 1,600
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 276 50 1,779
GPT-5 Mini 3.0 10.0 0.0% 0 9.99s 195 160 1,856

দ্রুত তুলনা

তুলনার জুটি বদলান