AI BENCHY
তুলনা করুন
❤️ Made by XCS
Your ad here

মডেলের নাম

OpenAI: GPT-5.3-Codex

যুক্তি (medium)

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে : ২৪ ফেব, ২০২৬

মেট্রিক OpenAI: GPT-5.3-Codex
র‍্যাঙ্ক#6
কোম্পানিOpenAI
Score 7.77
ধারাবাহিকতা 8.75
প্রতি ফলাফলে খরচ 4.9342
মোট খরচ $0.44408
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.9%
অস্থির টেস্ট 2
আউটপুট টোকেন 947
রিজনিং টোকেন 29,564
প্রতিক্রিয়া সময় (গড়)17944ms
প্রতিক্রিয়া সময় (মোট)233267ms
প্রতিক্রিয়া সময় (সর্বোচ্চ)100927ms

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ সম্পূর্ণভাবে পাস হওয়া টেস্ট Score ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট যুক্তি স্কোর প্রতিক্রিয়া সময় (গড়) খরচ
অ্যান্টি-এআই কৌশল 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
ডেটা পার্সিং ও নিষ্কাশন 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
ডোমেইন-নির্দিষ্ট 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
নির্দেশনা অনুসরণ 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

তুলনা করা মডেল

OpenAI: GPT-5.3-Codex এর সাথে তুলনা করুন...

#5 · Google

Google: Gemini 3 Flash Preview

যুক্তি (low)

Score: 8.23

ধারাবাহিকতা: 8.71

প্রতি চেষ্টায় পাস রেট: 82.0%

অস্থির টেস্ট: 2

প্রতি ফলাফলে খরচ: 0.6173

সঠিক টেস্ট:

মোট খরচ: $0.06174

তুলনা করুন

#7 · OpenAI

OpenAI: GPT-5.2

যুক্তি (medium)

Score: 7.38

ধারাবাহিকতা: 8.73

প্রতি চেষ্টায় পাস রেট: 76.9%

অস্থির টেস্ট: 2

প্রতি ফলাফলে খরচ: 2.5637

সঠিক টেস্ট:

মোট খরচ: $0.23074

তুলনা করুন

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

যুক্তি (medium)

Score: 8.54

ধারাবাহিকতা: 9.35

প্রতি চেষ্টায় পাস রেট: 87.2%

অস্থির টেস্ট: 1

প্রতি ফলাফলে খরচ: 2.1621

সঠিক টেস্ট:

মোট খরচ: $0.23784

তুলনা করুন

দ্রুত তুলনা

OpenAI: GPT-5.3-Codex এর সাথে তুলনা করুন...