নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Google: Gemini 3.1 Flash Lite

সারাংশ

Claude Sonnet 5 vs Gemini 3.1 Flash Lite benchmark তুলনা: Gemini 3.1 Flash Lite average score-এ এগিয়ে: 6.1 vs 5.7. Gemini 3.1 Flash Lite-এর benchmark খরচ কম: $0.013 vs $0.287. Gemini 3.1 Flash Lite দ্রুত: 1.33s vs 4.74s, pass rates 42.9% vs 54.0%.

প্রস্তাবিত মডেল: Gemini 3.1 Flash Lite - It has the best score here (6.1), while costing about 22.1x less than Claude Sonnet 5.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-30

মেট্রিক Claude Sonnet 5 Claude Sonnet 5 none প্রকাশ: 2026-06-30 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal প্রকাশ: 2026-05-08
স্কোর 5.7 6.1
র‍্যাঙ্ক #117 #96
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.6 8.8
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 42.9% 54.0%
অস্থির টেস্ট 4 3
মোট রান 63 63
প্রতি ফলাফলে খরচ 4.098 0.130
মোট খরচ $0.287 $0.013
ইনপুট মূল্য $2.000 / 1M $0.250 / 1M
আউটপুট মূল্য $10.000 / 1M $1.500 / 1M
মোট ইনপুট টোকেন 76,797 36,973
আউটপুট টোকেন 13,325 2,487
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 4.74s 1.33s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 29.46s 4.49s
প্রতিক্রিয়া সময় (মোট) 99.46s 27.91s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
খরচ
$0.061
সময়
53.7s
টোকেন
6,172 tok

#96 Gemini 3.1 Flash Lite

minimal
খরচ
$0.001
সময়
3.7s
টোকেন
635 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 500 639 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Gemini 3.1 Flash Lite 5.5 10.0 33.3% 0 831ms 8,126 666 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 12,870 357 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 7,552 279 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 641 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 490 63 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 615 72 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 564 153 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 5,457 234 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 158 9 0

দ্রুত তুলনা

তুলনার জুটি বদলান