নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: gpt-oss-120b

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-29

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য
স্কোর 7.6 5.8
র‍্যাঙ্ক #49 #88
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 9.1 7.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 70.4% 51.9%
অস্থির টেস্ট 2 6
মোট রান 54 54
প্রতি ফলাফলে খরচ 12.047 0.144
মোট খরচ $1.446 $0.011
???? ??? $5.000 / 1M $0.000 / 1M
????? ??? $25.000 / 1M $0.000 / 1M
আউটপুট টোকেন 29,829 13,493
রিজনিং টোকেন 18,938 36,879
প্রতিক্রিয়া সময় (গড়) 21.08s 16.08s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 50.92s
প্রতিক্রিয়া সময় (মোট) 231.84s 176.88s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083

দ্রুত তুলনা

তুলনার জুটি বদলান