নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Qwen: Qwen3.6 Max Preview

সারাংশ

gpt-oss-120b vs Qwen3.6 Max Preview benchmark তুলনা: gpt-oss-120b average score-এ এগিয়ে: 6.7 vs 6.0. gpt-oss-120b-এর benchmark খরচ কম: $0.013 vs $0.075. Qwen3.6 Max Preview দ্রুত: 3.30s vs 22.28s, pass rates 52.4% vs 58.7%.

প্রস্তাবিত মডেল: gpt-oss-120b - It has the best score here (6.7), while costing about 6.1x less than Qwen3.6 Max Preview.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য Qwen3.6 Max Preview Qwen3.6 Max Preview none প্রকাশ: 2026-04-20
স্কোর 6.7 6.0
র‍্যাঙ্ক #78 #100
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.0 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 52.4% 58.7%
অস্থির টেস্ট 5 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.141 0.824
মোট খরচ $0.013 $0.075
ইনপুট মূল্য $0.039 / 1M $1.040 / 1M
আউটপুট মূল্য $0.180 / 1M $6.240 / 1M
মোট ইনপুট টোকেন 39,084 42,509
আউটপুট টোকেন 20,013 4,779
রিজনিং টোকেন 50,233 0
প্রতিক্রিয়া সময় (গড়) 22.28s 3.30s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 68.16s 20.51s
প্রতিক্রিয়া সময় (মোট) 311.96s 69.40s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 gpt-oss-120b

medium
খরচ
$0.001
সময়
26.7s
টোকেন
555 tok

#100 Qwen3.6 Max Preview

none
খরচ
$0.025
সময়
83.9s
টোকেন
4,066 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

দ্রুত তুলনা

তুলনার জুটি বদলান