নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.5 vs Qwen: Qwen3.5-Flash

সারাংশ

GPT-5.5 vs Qwen3.5-Flash benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 6.8. Qwen3.5-Flash-এর benchmark খরচ কম: $0.080 vs $0.907. GPT-5.5 দ্রুত: 9.76s vs 63.29s, pass rates 85.7% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.3), while responding about 6.5x faster than Qwen3.5-Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24 Qwen3.5-Flash Qwen3.5-Flash medium প্রকাশ: 2026-02-24
স্কোর 9.3 6.8
র‍্যাঙ্ক #4 #70
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 10.0 8.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 85.7% 71.4%
অস্থির টেস্ট 0 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 5.035 0.871
মোট খরচ $0.907 $0.080
ইনপুট মূল্য $5.000 / 1M $0.065 / 1M
আউটপুট মূল্য $30.000 / 1M $0.260 / 1M
মোট ইনপুট টোকেন 34,209 38,926
আউটপুট টোকেন 2,046 2,088
রিজনিং টোকেন 22,460 294,598
প্রতিক্রিয়া সময় (গড়) 9.76s 63.29s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 56.19s 234.29s
প্রতিক্রিয়া সময় (মোট) 204.92s 1265.85s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
খরচ
$0.068
সময়
37.0s
টোকেন
2,339 tok

#70 Qwen3.5-Flash

medium
খরচ
$0.002
সময়
25.8s
টোকেন
4,294 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 672 383 32,992
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Qwen3.5-Flash 3.7 7.2 22.2% 1 58.87s 6,685 302 90,081
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 14,934 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 6,061 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 581 58 43,615
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 516 99 38,486
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 699 98 14,139
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Qwen3.5-Flash 8.2 7.2 88.9% 1 27.61s 381 89 12,457
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 8,193 309 1,284
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 204 32 37,037

দ্রুত তুলনা

তুলনার জুটি বদলান