নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Trinity Large Preview vs StepFun: Step 3.5 Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Trinity Large Preview none প্রকাশ: 2026-01-27 বিনামূল্যে উপলভ্য StepFun: Step 3.5 Flash medium প্রকাশ: 2026-02-01 বিনামূল্যে উপলভ্য
র‍্যাঙ্ক #45 #13
গড় স্কোর 4.2 7.4
ধারাবাহিকতা 9.6 9.1
প্রতি ফলাফলে খরচ 0.000 0.000
মোট খরচ $0.000 $0.000
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 33.3% 68.8%
অস্থির টেস্ট 1 2
মোট রান 48 (16 x 3) 48 (16 x 3)
আউটপুট টোকেন 1,837 71,452
রিজনিং টোকেন 0 155,147
প্রতিক্রিয়া সময় (গড়) 3.15s 29.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 8.91s 170.45s
প্রতিক্রিয়া সময় (মোট) 50.46s 290.96s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

দ্রুত তুলনা

তুলনার জুটি বদলান