নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3 Flash Preview

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-28

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 medium প্রকাশ: 2026-05-28 Gemini 3 Flash Preview Gemini 3 Flash Preview none প্রকাশ: 2025-12-17
স্কোর 8.7 7.7
র‍্যাঙ্ক #12 #42
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.6 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 83.3% 70.0%
অস্থির টেস্ট 1 2
মোট রান 60 60
প্রতি ফলাফলে খরচ 6.285 0.175
মোট খরচ $1.006 $0.023
ইনপুট মূল্য $5.000 / 1M $0.500 / 1M
আউটপুট মূল্য $25.000 / 1M $3.000 / 1M
আউটপুট টোকেন 23,201 1,879
রিজনিং টোকেন 5,901 0
প্রতিক্রিয়া সময় (গড়) 9.34s 1.70s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 38.03s 3.56s
প্রতিক্রিয়া সময় (মোট) 186.84s 22.05s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3 Flash Preview 8.3 10.0 75.0% 0 1.25s 214 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3 Flash Preview 6.8 10.0 50.0% 0 2.19s 447 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3 Flash Preview 4.7 1.6 66.7% 1 3.56s 350 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.41s 279 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 963ms 18 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.13s 104 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3 Flash Preview 6.4 5.8 66.7% 1 1.58s 74 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 1.05s 144 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.35s 234 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 1.07s 15 0

দ্রুত তুলনা

তুলনার জুটি বদলান