নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক OpenAI: GPT-5.3 Chat none প্রকাশ: 2026-03-03 Qwen: Qwen3.5-Flash medium প্রকাশ: 2026-02-24
গড় স্কোর 7.3 6.9
র‍্যাঙ্ক #19 #24
সঠিক টেস্ট
ধারাবাহিকতা 8.5 7.5
প্রতি ফলাফলে খরচ 3.163 0.720
মোট খরচ $0.317 $0.072
প্রতি চেষ্টায় পাস রেট 70.8% 81.3%
অস্থির টেস্ট 3 5
common.totalRuns 48 (16 x 3) 48 (16 x 3)
আউটপুট টোকেন 19,272 1,807
রিজনিং টোকেন 0 169,952
প্রতিক্রিয়া সময় (গড়) 5.96s 70.81s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 234.29s
প্রতিক্রিয়া সময় (মোট) 95.30s 1132.90s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 7.3 7.5 77.8% 1 4.72s 3,091 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 9.9 10.0 100.0% 0 2.21s 942 0
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 4.4 33.3% 2 13.01s 8,264 0
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 4.0 10.0 0.0% 0 1.99s 319 0
Qwen: Qwen3.5-Flash 5.0 3.1 66.7% 1 40.05s 99 38,486
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 9.0 10.0 50.0% 0 3.29s 1,455 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

দ্রুত তুলনা

তুলনার জুটি বদলান