নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.7 Max

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05 Qwen3.7 Max Qwen3.7 Max medium প্রকাশ: 2026-05-22
স্কোর 8.0 9.1
র‍্যাঙ্ক #21 #5
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.6 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 76.2% 88.9%
অস্থির টেস্ট 4 1
মোট রান 63 63
প্রতি ফলাফলে খরচ 8.640 5.517
মোট খরচ $1.210 $0.523
ইনপুট মূল্য $2.500 / 1M $1.250 / 1M
আউটপুট মূল্য $15.000 / 1M $3.750 / 1M
মোট ইনপুট টোকেন 34,108 42,360
আউটপুট টোকেন 2,242 2,129
রিজনিং টোকেন 72,707 122,959
প্রতিক্রিয়া সময় (গড়) 22.35s 16.02s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.41s 59.98s
প্রতিক্রিয়া সময় (মোট) 469.29s 336.51s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Qwen3.7 Max 10.0 10.0 100.0% 0 6.36s 672 222 8,742
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.8 7.8 88.9% 1 44.36s 7,305 433 24,216
Qwen3.7 Max 10.0 10.0 100.0% 0 35.31s 7,893 423 34,808
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Qwen3.7 Max 10.0 10.0 100.0% 0 19.60s 14,934 366 8,405
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Qwen3.7 Max 10.0 10.0 100.0% 0 8.80s 7,782 270 6,254
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Qwen3.7 Max 5.9 7.2 55.6% 1 24.94s 771 61 31,793
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Qwen3.7 Max 10.0 10.0 100.0% 0 11.70s 516 135 4,457
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Qwen3.7 Max 10.0 10.0 100.0% 0 7.46s 699 102 5,452
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Qwen3.7 Max 10.0 10.0 100.0% 0 8.84s 696 259 8,908
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Qwen3.7 Max 10.0 10.0 100.0% 0 6.63s 8,193 267 1,220
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821
Qwen3.7 Max 3.0 10.0 0.0% 0 33.37s 204 24 12,920

দ্রুত তুলনা

তুলনার জুটি বদলান