নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs Z.ai: GLM 5

সারাংশ

Step 3.7 Flash vs GLM 5 benchmark তুলনা: GLM 5 average score-এ এগিয়ে: 8.6 vs 7.7. GLM 5-এর benchmark খরচ কম: $0.228 vs $0.341. Step 3.7 Flash দ্রুত: 15.74s vs 33.54s, pass rates 68.3% vs 82.5%.

প্রস্তাবিত মডেল: GLM 5 - It has the best score here (8.6), while costing about 1.5x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-17

মেট্রিক Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29 GLM 5 GLM 5 medium প্রকাশ: 2026-02-12
স্কোর 7.7 8.6
র‍্যাঙ্ক #39 #15
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.4 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.3% 82.5%
অস্থির টেস্ট 4 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 2.840 1.668
মোট খরচ $0.341 $0.228
ইনপুট মূল্য $0.200 / 1M $0.600 / 1M
আউটপুট মূল্য $1.150 / 1M $1.920 / 1M
মোট ইনপুট টোকেন 40,101 35,224
আউটপুট টোকেন 289,325 21,570
রিজনিং টোকেন 0 102,996
প্রতিক্রিয়া সময় (গড়) 15.74s 33.54s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 124.75s 99.85s
প্রতিক্রিয়া সময় (মোট) 330.63s 435.99s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#39 Step 3.7 Flash

low
Invalid SVG
Cost
$0.004
Time
25.3s
Tokens
3,072 tok

#15 GLM 5

medium
Cost
$0.005
Time
20.7s
Tokens
2,068 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

দ্রুত তুলনা

তুলনার জুটি বদলান