নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

StepFun: Step 3.7 Flash vs xAI: Grok 4.3

সারাংশ

Step 3.7 Flash vs Grok 4.3 benchmark তুলনা: Grok 4.3 average score-এ এগিয়ে: 7.7 vs 7.1. Grok 4.3-এর benchmark খরচ কম: $0.614 vs $1.148. Grok 4.3 দ্রুত: 47.51s vs 64.46s, pass rates 63.5% vs 71.4%.

প্রস্তাবিত মডেল: Grok 4.3 - It has the best score here (7.7), while costing about 1.9x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29 Grok 4.3 Grok 4.3 medium প্রকাশ: 2026-05-01
স্কোর 7.1 7.7
র‍্যাঙ্ক #63 #40
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.2 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 71.4%
অস্থির টেস্ট 4 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 10.434 4.724
মোট খরচ $1.148 $0.614
ইনপুট মূল্য $0.200 / 1M $1.250 / 1M
আউটপুট মূল্য $1.150 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 38,391 44,472
আউটপুট টোকেন 991,355 1,981
রিজনিং টোকেন 0 221,382
প্রতিক্রিয়া সময় (গড়) 64.46s 47.51s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 364.99s 216.69s
প্রতিক্রিয়া সময় (মোট) 1353.57s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

দ্রুত তুলনা

তুলনার জুটি বদলান