নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Flash Lite Preview

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-28

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 medium প্রকাশ: 2026-05-28 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low প্রকাশ: 2026-03-03
স্কোর 8.7 7.6
র‍্যাঙ্ক #12 #47
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.6 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 83.3% 65.0%
অস্থির টেস্ট 1 0
মোট রান 60 60
প্রতি ফলাফলে খরচ 6.285 0.186
মোট খরচ $1.006 $0.025
ইনপুট মূল্য $5.000 / 1M $0.250 / 1M
আউটপুট মূল্য $25.000 / 1M $1.500 / 1M
আউটপুট টোকেন 23,201 2,280
রিজনিং টোকেন 5,901 8,829
প্রতিক্রিয়া সময় (গড়) 9.34s 2.85s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 38.03s 11.91s
প্রতিক্রিয়া সময় (মোট) 186.84s 57.08s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.1 Flash Lite Preview 8.3 10.0 75.0% 0 2.12s 462 1,638
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.1 Flash Lite Preview 6.8 10.0 50.0% 0 1.56s 654 723
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 11.91s 225 762
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.00s 291 696
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 2.36s 18 1,212
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 1.54s 69 384
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.69s 243 1,248
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 1.35s 9 420

দ্রুত তুলনা

তুলনার জুটি বদলান