নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Flash Lite Preview

সারাংশ

Claude Opus 4.8 vs Gemini 3.1 Flash Lite Preview benchmark তুলনা: average score প্রায় সমান: 7.7 vs 7.8. Gemini 3.1 Flash Lite Preview-এর benchmark খরচ কম: $0.068 vs $1.270. Gemini 3.1 Flash Lite Preview দ্রুত: 3.96s vs 10.83s, pass rates 79.4% vs 61.9%.

প্রস্তাবিত মডেল: Gemini 3.1 Flash Lite Preview - It has the best score here (7.8), while costing about 18.7x less than Claude Opus 4.8.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-30

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 low প্রকাশ: 2026-05-28 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium প্রকাশ: 2026-03-03
স্কোর 7.7 7.8
র‍্যাঙ্ক #38 #33
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 10.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 79.4% 61.9%
অস্থির টেস্ট 3 0
মোট রান 63 63
প্রতি ফলাফলে খরচ 8.466 0.523
মোট খরচ $1.270 $0.068
ইনপুট মূল্য $5.000 / 1M $0.250 / 1M
আউটপুট মূল্য $25.000 / 1M $1.500 / 1M
মোট ইনপুট টোকেন 60,946 37,786
আউটপুট টোকেন 31,771 2,210
রিজনিং টোকেন 6,831 36,744
প্রতিক্রিয়া সময় (গড়) 10.83s 3.96s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 127.97s 14.93s
প্রতিক্রিয়া সময় (মোট) 227.39s 83.06s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
খরচ
$0.031
সময়
14.1s
টোকেন
1,345 tok

#33 Gemini 3.1 Flash Lite Preview

medium
খরচ
$0.003
সময়
5.2s
টোকেন
1,944 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
Gemini 3.1 Flash Lite Preview 9.1 10.0 75.0% 0 2.33s 512 570 4,305
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
Gemini 3.1 Flash Lite Preview 5.5 10.0 33.3% 0 4.09s 8,126 461 8,597
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 14.93s 13,403 327 7,347
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.29s 7,362 279 2,952
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 4.21s 639 18 5,325
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.16s 488 96 1,488
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.91s 621 72 2,121
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 5.30s 566 141 1,896
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.80s 5,909 234 912
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 2.68s 160 12 1,801

দ্রুত তুলনা

তুলনার জুটি বদলান