নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs OpenAI: GPT-5.4

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক OpenAI: GPT-5.3-Codex medium প্রকাশ: 2026-02-05 OpenAI: GPT-5.4 medium প্রকাশ: 2026-03-05
গড় স্কোর 8.7 8.2
র‍্যাঙ্ক #4 #7
সঠিক টেস্ট
ধারাবাহিকতা 9.0 8.9
প্রতি ফলাফলে খরচ 4.418 6.533
মোট খরচ $0.531 $0.784
প্রতি চেষ্টায় পাস রেট 88.9% 86.7%
অস্থির টেস্ট 2 2
common.totalRuns 45 (15 x 3) 45 (15 x 3)
আউটপুট টোকেন 1,577 1,611
রিজনিং টোকেন 33,017 46,321
প্রতিক্রিয়া সময় (গড়) 17.37s 21.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.93s 100.41s
প্রতিক্রিয়া সময় (মোট) 260.52s 315.95s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 10.0 10.0 100.0% 0 4.69s 216 1,421
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 9.9 10.0 100.0% 0 3.07s 234 728
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 4.0 7.2 55.6% 1 64.31s 64 25,308
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 9.3 7.9 88.9% 1 5.12s 352 1,644
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

দ্রুত তুলনা

তুলনার জুটি বদলান