নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.5 Plus 2026-04-20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-26

মেট্রিক gpt-oss-120b gpt-oss-120b none প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none প্রকাশ: 2026-04-20
স্কোর 5.4 5.8
র‍্যাঙ্ক #119 #103
নির্ভরযোগ্যতা 10.0 9.9
ধারাবাহিকতা 9.1 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 38.6% 43.3%
অস্থির টেস্ট 2 4
মোট রান 57 60
প্রতি ফলাফলে খরচ 0.168 0.582
মোট খরচ $0.011 $0.041
???? ??? $0.000 / 1M $0.300 / 1M
????? ??? $0.000 / 1M $1.800 / 1M
আউটপুট টোকেন 51,664 11,139
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 21.61s 4.57s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 113.71s 33.34s
প্রতিক্রিয়া সময় (মোট) 345.79s 91.37s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
Qwen3.5 Plus 2026-04-20 4.8 10.0 25.0% 0 1.88s 557 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Qwen3.5 Plus 2026-04-20 4.4 6.7 16.7% 1 2.08s 474 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5 Plus 2026-04-20 2.8 1.6 33.3% 1 13.32s 2,275 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 2.82s 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Qwen3.5 Plus 2026-04-20 5.3 10.0 33.3% 0 4.43s 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
Qwen3.5 Plus 2026-04-20 4.8 10.0 0.0% 0 1.41s 119 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,940 0
Qwen3.5 Plus 2026-04-20 6.2 5.8 66.7% 1 1.17s 68 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 3,982 0
Qwen3.5 Plus 2026-04-20 6.7 7.9 55.6% 1 1.97s 583 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Qwen3.5 Plus 2026-04-20 10.0 10.0 100.0% 0 4.42s 297 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0
Qwen3.5 Plus 2026-04-20 3.0 10.0 0.0% 0 33.34s 6,505 0

দ্রুত তুলনা

তুলনার জুটি বদলান