নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs xAI: Grok Build 0.1

সারাংশ

Step 3.7 Flash vs Grok Build 0.1 benchmark তুলনা: Grok Build 0.1 average score-এ এগিয়ে: 7.6 vs 7.1. Grok Build 0.1-এর benchmark খরচ কম: $0.927 vs $1.148. Grok Build 0.1 দ্রুত: 49.90s vs 64.46s, pass rates 63.5% vs 61.9%.

প্রস্তাবিত মডেল: Grok Build 0.1 - It has the strongest score in this comparison (7.6) and the best overall balance of cost and response time across all 2 models.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-02

মেট্রিক Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29 Grok Build 0.1 Grok Build 0.1 medium প্রকাশ: 2026-05-21
স্কোর 7.1 7.6
র‍্যাঙ্ক #65 #44
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.2 9.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 61.9%
অস্থির টেস্ট 4 0
মোট রান 63 63
প্রতি ফলাফলে খরচ 10.434 7.124
মোট খরচ $1.148 $0.927
ইনপুট মূল্য $0.200 / 1M $1.000 / 1M
আউটপুট মূল্য $1.150 / 1M $2.000 / 1M
মোট ইনপুট টোকেন 38,391 44,418
আউটপুট টোকেন 991,355 2,782
রিজনিং টোকেন 0 438,018
প্রতিক্রিয়া সময় (গড়) 64.46s 49.90s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 364.99s 252.69s
প্রতিক্রিয়া সময় (মোট) 1353.57s 1047.92s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#65 Step 3.7 Flash

high
খরচ
$0.007
সময়
63.6s
টোকেন
6,030 tok

#44 xAI: Grok Build 0.1

medium
খরচ
$0.028
সময়
81.3s
টোকেন
14,009 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

দ্রুত তুলনা

তুলনার জুটি বদলান