নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Qwen: Qwen3.7 Max

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-22

মেট্রিক GPT-5.3-Codex GPT-5.3-Codex medium প্রকাশ: 2026-02-05 Qwen3.7 Max Qwen3.7 Max medium প্রকাশ: 2026-05-22
স্কোর 8.3 9.0
র‍্যাঙ্ক #15 #5
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 81.7% 88.3%
অস্থির টেস্ট 4 1
মোট রান 60 60
প্রতি ফলাফলে খরচ 4.891 5.540
মোট খরচ $0.685 $0.942
???? ??? $1.750 / 1M $2.500 / 1M
????? ??? $14.000 / 1M $7.500 / 1M
আউটপুট টোকেন 2,332 2,109
রিজনিং টোকেন 42,616 110,285
প্রতিক্রিয়া সময় (গড়) 15.97s 13.83s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.93s 33.37s
প্রতিক্রিয়া সময় (মোট) 319.30s 276.53s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 222 8,742
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 10.0 10.0 100.0% 0 18.45s 514 7,266
Qwen3.7 Max 10.0 10.0 100.0% 0 22.98s 403 22,134
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 366 8,405
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 270 6,254
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 61 31,793
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 135 4,457
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 102 5,452
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 259 8,908
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 267 1,220
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 24 12,920

দ্রুত তুলনা

তুলনার জুটি বদলান