নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Poolside: Laguna XS 2.1

সারাংশ

GPT-5.3 Chat vs Laguna XS 2.1 benchmark তুলনা: GPT-5.3 Chat average score-এ এগিয়ে: 7.5 vs 7.0. Laguna XS 2.1-এর benchmark খরচ কম: $0.036 vs $0.433. GPT-5.3 Chat দ্রুত: 6.34s vs 30.08s, pass rates 66.7% vs 44.4%.

প্রস্তাবিত মডেল: Laguna XS 2.1 - Its score stays close to the best score here (7.0 vs 7.5), while costing about 12.3x less than GPT-5.3 Chat.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03 Laguna XS 2.1 Laguna XS 2.1 medium প্রকাশ: 2026-07-02 বিনামূল্যে উপলভ্য
স্কোর 7.5 7.0
র‍্যাঙ্ক #47 #67
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.1 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 44.4%
অস্থির টেস্ট 5 1
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.605 0.392
মোট খরচ $0.433 $0.036
ইনপুট মূল্য $1.750 / 1M $0.060 / 1M
আউটপুট মূল্য $14.000 / 1M $0.120 / 1M
মোট ইনপুট টোকেন 34,209 45,324
আউটপুট টোকেন 26,617 25,761
রিজনিং টোকেন 0 268,677
প্রতিক্রিয়া সময় (গড়) 6.34s 30.08s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 155.23s
প্রতিক্রিয়া সময় (মোট) 133.13s 631.77s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 GPT-5.3 Chat

none
খরচ
$0.008
সময়
8.1s
টোকেন
634 tok

#67 Laguna XS 2.1

medium
খরচ
$0.001
সময়
30.6s
টোকেন
4,678 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Laguna XS 2.1 4.8 10.0 25.0% 0 41.96s 774 353 73,090
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Laguna XS 2.1 5.5 10.0 33.3% 0 70.35s 7,995 23,767 83,258
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Laguna XS 2.1 9.6 10.0 100.0% 0 13.43s 18,033 507 5,908
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Laguna XS 2.1 10.0 10.0 100.0% 0 4.50s 7,734 234 3,129
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Laguna XS 2.1 2.9 7.2 11.1% 1 65.66s 834 17 91,533
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Laguna XS 2.1 5.0 10.0 0.0% 0 4.15s 537 119 1,375
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Laguna XS 2.1 9.8 10.0 100.0% 0 2.57s 753 82 1,844
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Laguna XS 2.1 5.3 10.0 33.3% 0 3.43s 771 357 3,355
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Laguna XS 2.1 10.0 10.0 100.0% 0 3.01s 7,638 309 748
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Laguna XS 2.1 3.0 10.0 0.0% 0 10.88s 255 16 4,437

দ্রুত তুলনা

তুলনার জুটি বদলান