নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Elephant

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-14

মেট্রিক GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05 Elephant Elephant medium প্রকাশ: 2026-04-14
স্কোর 5.9 5.2
র‍্যাঙ্ক #63 #77
ধারাবাহিকতা 9.1 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 42.6% 29.6%
অস্থির টেস্ট 2 1
মোট রান 54 54
প্রতি ফলাফলে খরচ 1.477 0.000
মোট খরচ $0.104 $0.000
???? ??? $2.500 / 1M $0.000 / 1M
????? ??? $15.000 / 1M $0.000 / 1M
আউটপুট টোকেন 2,317 2,596
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.51s 1.27s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.95s 3.70s
প্রতিক্রিয়া সময় (মোট) 27.21s 22.82s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

দ্রুত তুলনা

তুলনার জুটি বদলান