নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Elephant

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-14

মেট্রিক gpt-oss-120b gpt-oss-120b medium প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য Elephant Elephant none প্রকাশ: 2026-04-14
স্কোর 5.8 5.2
র‍্যাঙ্ক #65 #81
ধারাবাহিকতা 7.2 9.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 51.9% 31.5%
অস্থির টেস্ট 6 1
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.144 0.000
মোট খরচ $0.011 $0.000
???? ??? $0.039 / 1M $0.000 / 1M
????? ??? $0.190 / 1M $0.000 / 1M
আউটপুট টোকেন 13,493 2,573
রিজনিং টোকেন 36,879 0
প্রতিক্রিয়া সময় (গড়) 16.08s 1.23s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 50.92s 3.81s
প্রতিক্রিয়া সময় (মোট) 176.88s 22.16s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Elephant 6.6 10.0 50.0% 0 963ms 610 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 1.1 66.7% 1 26.33s 228 2,549
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Elephant 4.0 10.0 0.0% 0 854ms 106 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
Elephant 3.3 10.0 0.0% 0 849ms 170 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

দ্রুত তুলনা

তুলনার জুটি বদলান