নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Trinity Large Preview

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক Anthropic: Claude Opus 4.6 medium প্রকাশ: 2026-02-05 Trinity Large Preview none প্রকাশ: 2026-01-27 বিনামূল্যে উপলভ্য
র‍্যাঙ্ক #26 #45
গড় স্কোর 6.6 4.2
ধারাবাহিকতা 9.0 9.6
প্রতি ফলাফলে খরচ 13.118 0.000
মোট খরচ $1.312 $0.000
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 33.3%
অস্থির টেস্ট 2 1
মোট রান 48 48
আউটপুট টোকেন 26,254 1,837
রিজনিং টোকেন 17,363 0
প্রতিক্রিয়া সময় (গড়) 22.86s 3.15s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 8.91s
প্রতিক্রিয়া সময় (মোট) 205.71s 50.46s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 4.0 4.4 55.6% 2 11.88s 897 1,000
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 9.9 10.0 100.0% 0 7.37s 691 757
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 10.0 10.0 0.0% 0 83.40s 14,642 8,687
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 7.0 10.0 66.7% 0 4.60s 531 637
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0

দ্রুত তুলনা

তুলনার জুটি বদলান