নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.6 Flash

সারাংশ

GPT-5.3 Chat vs Qwen3.6 Flash benchmark তুলনা: Qwen3.6 Flash average score-এ এগিয়ে: 7.5 vs 7.2. Qwen3.6 Flash-এর benchmark খরচ কম: $0.288 vs $0.433. GPT-5.3 Chat দ্রুত: 6.34s vs 19.25s, pass rates 66.7% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.3 Chat - Its score stays close to the best score here (7.2 vs 7.5), while responding about 3.0x faster than Qwen3.6 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-10

মেট্রিক GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03 Qwen3.6 Flash Qwen3.6 Flash medium প্রকাশ: 2026-04-20
স্কোর 7.2 7.5
র‍্যাঙ্ক #64 #40
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.1 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 71.4%
অস্থির টেস্ট 5 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.605 3.030
মোট খরচ $0.433 $0.288
ইনপুট মূল্য $1.750 / 1M $0.188 / 1M
আউটপুট মূল্য $14.000 / 1M $1.125 / 1M
মোট ইনপুট টোকেন 34,209 42,362
আউটপুট টোকেন 26,617 2,995
রিজনিং টোকেন 0 245,358
প্রতিক্রিয়া সময় (গড়) 6.34s 19.25s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 122.87s
প্রতিক্রিয়া সময় (মোট) 133.13s 404.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#64 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

#40 Qwen3.6 Flash

medium
Invalid SVG
Cost
$0.008
Time
29.9s
Tokens
6,784 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.10s 672 624 14,024
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Qwen3.6 Flash 5.0 5.1 44.5% 2 42.85s 7,895 495 67,967
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 20.28s 14,934 483 13,839
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 9.65s 7,782 270 13,155
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Qwen3.6 Flash 3.5 4.4 33.3% 2 14.65s 771 60 24,409
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Qwen3.6 Flash 4.8 9.9 0.0% 0 9.88s 516 140 5,445
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 6.05s 699 102 7,423
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Qwen3.6 Flash 8.2 7.2 88.9% 1 6.29s 696 460 10,860
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 4.00s 8,193 335 1,188
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 122.87s 204 26 87,048

দ্রুত তুলনা

তুলনার জুটি বদলান