নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 vs OpenAI: GPT-5.4 Mini

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-17

মেট্রিক GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11 GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17
র‍্যাঙ্ক #30 #34
স্কোর 7.3 7.1
ধারাবাহিকতা 8.0 7.2
প্রতি ফলাফলে খরচ 3.131 3.610
মোট খরচ $0.314 $0.289
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 70.6% 68.6%
অস্থির টেস্ট 4 6
মোট রান 51 51
আউটপুট টোকেন 2,238 1,708
রিজনিং টোকেন 16,811 58,019
প্রতিক্রিয়া সময় (গড়) 13.93s 15.66s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 77.80s 102.91s
প্রতিক্রিয়া সময় (মোট) 139.29s 266.14s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594

দ্রুত তুলনা

তুলনার জুটি বদলান