নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 vs Qwen: Qwen3.5-Flash

সারাংশ

GPT-5.2 vs Qwen3.5-Flash benchmark তুলনা: GPT-5.2 average score-এ এগিয়ে: 8.4 vs 6.8. Qwen3.5-Flash-এর benchmark খরচ কম: $0.080 vs $0.548. GPT-5.2 দ্রুত: 16.88s vs 63.29s, pass rates 71.4% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.2 - It has the best score here (8.4), while responding about 3.7x faster than Qwen3.5-Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.2 GPT-5.2 medium প্রকাশ: 2025-12-11 Qwen3.5-Flash Qwen3.5-Flash medium প্রকাশ: 2026-02-24
স্কোর 8.4 6.8
র‍্যাঙ্ক #22 #70
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 71.4% 71.4%
অস্থির টেস্ট 4 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.209 0.871
মোট খরচ $0.548 $0.080
ইনপুট মূল্য $1.750 / 1M $0.065 / 1M
আউটপুট মূল্য $14.000 / 1M $0.260 / 1M
মোট ইনপুট টোকেন 33,967 38,926
আউটপুট টোকেন 2,901 2,088
রিজনিং টোকেন 31,932 294,598
প্রতিক্রিয়া সময় (গড়) 16.88s 63.29s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 77.80s 234.29s
প্রতিক্রিয়া সময় (মোট) 236.34s 1265.85s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#22 GPT-5.2

medium
খরচ
$0.047
সময়
49.2s
টোকেন
3,396 tok

#70 Qwen3.5-Flash

medium
খরচ
$0.002
সময়
25.8s
টোকেন
4,294 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

দ্রুত তুলনা

তুলনার জুটি বদলান