নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5.4

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-15

মেট্রিক GPT-5.2 Chat GPT-5.2 Chat none প্রকাশ: 2025-12-11 GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05
র‍্যাঙ্ক #17 #9
স্কোর 8.0 8.5
ধারাবাহিকতা 9.1 8.5
প্রতি ফলাফলে খরচ 2.440 6.601
মোট খরচ $0.269 $0.793
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 75.0% 83.3%
অস্থির টেস্ট 2 3
মোট রান 48 48
আউটপুট টোকেন 15,845 1,756
রিজনিং টোকেন 0 46,642
প্রতিক্রিয়া সময় (গড়) 7.03s 20.05s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 38.52s 100.41s
প্রতিক্রিয়া সময় (মোট) 112.51s 320.87s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.97s 1,651 0
GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

দ্রুত তুলনা

তুলনার জুটি বদলান