নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Qwen: Qwen3.5-35B-A3B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-15

মেট্রিক GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium প্রকাশ: 2026-02-24
র‍্যাঙ্ক #23 #33
স্কোর 7.8 7.1
ধারাবাহিকতা 8.5 6.3
প্রতি ফলাফলে খরচ 3.163 4.251
মোট খরচ $0.317 $0.341
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 70.8% 77.1%
অস্থির টেস্ট 3 7
মোট রান 48 48
আউটপুট টোকেন 19,272 5,495
রিজনিং টোকেন 0 169,266
প্রতিক্রিয়া সময় (গড়) 5.96s 43.93s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 106.00s
প্রতিক্রিয়া সময় (মোট) 95.30s 702.85s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 7.9 7.5 77.8% 1 4.72s 3,091 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.75s 429 36,235
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Qwen3.5-35B-A3B 4.7 1.6 66.7% 1 75.34s 775 12,485
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Qwen3.5-35B-A3B 7.3 5.9 83.3% 1 59.33s 235 19,493
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Qwen3.5-35B-A3B 4.1 4.4 44.5% 2 88.34s 41 46,368
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Qwen3.5-35B-A3B 2.8 1.6 33.3% 1 30.30s 20 3,753
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Qwen3.5-35B-A3B 6.4 4.4 77.8% 2 31.58s 3,589 32,206
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

দ্রুত তুলনা

তুলনার জুটি বদলান