নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 vs Qwen: Qwen3.7 Plus

সারাংশ

GPT-5.2 vs Qwen3.7 Plus benchmark তুলনা: GPT-5.2 average score-এ এগিয়ে: 8.4 vs 7.2. Qwen3.7 Plus-এর benchmark খরচ কম: $0.023 vs $0.548. Qwen3.7 Plus দ্রুত: 2.85s vs 16.88s, pass rates 71.4% vs 47.6%.

প্রস্তাবিত মডেল: Qwen3.7 Plus - It offers the best overall trade-off: a competitive score (7.2), lower cost than GPT-5.2, and balanced response time.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11 Qwen3.7 Plus Qwen3.7 Plus none প্রকাশ: 2026-06-03
স্কোর 8.4 7.2
র‍্যাঙ্ক #22 #62
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 71.4% 47.6%
অস্থির টেস্ট 4 0
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.209 0.276
মোট খরচ $0.548 $0.023
ইনপুট মূল্য $1.750 / 1M $0.320 / 1M
আউটপুট মূল্য $14.000 / 1M $1.280 / 1M
মোট ইনপুট টোকেন 33,967 42,510
আউটপুট টোকেন 2,901 6,578
রিজনিং টোকেন 31,932 0
প্রতিক্রিয়া সময় (গড়) 16.88s 2.85s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 77.80s 29.38s
প্রতিক্রিয়া সময় (মোট) 236.34s 59.86s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2

medium
খরচ
$0.047
সময়
49.2s
টোকেন
3,396 tok

#62 Qwen3.7 Plus

none
খরচ
$0.019
সময়
213.5s
টোকেন
11,960 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Qwen3.7 Plus 6.5 10.0 50.0% 0 1.38s 696 349 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
Qwen3.7 Plus 5.5 10.0 33.3% 0 2.15s 7,911 639 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Qwen3.7 Plus 10.0 10.0 100.0% 0 29.38s 14,952 4,505 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Qwen3.7 Plus 10.0 10.0 100.0% 0 1.43s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Qwen3.7 Plus 3.0 10.0 0.0% 0 868ms 789 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Qwen3.7 Plus 5.3 10.0 0.0% 0 1.33s 522 78 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Qwen3.7 Plus 6.3 10.0 50.0% 0 929ms 711 72 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Qwen3.7 Plus 7.7 10.0 66.7% 0 1.71s 714 443 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Qwen3.7 Plus 10.0 10.0 100.0% 0 3.54s 8,211 222 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223
Qwen3.7 Plus 3.0 10.0 0.0% 0 1.21s 210 9 0

দ্রুত তুলনা

তুলনার জুটি বদলান