নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

StepFun: Step 3.7 Flash vs Z.ai: GLM 5.1

সারাংশ

Step 3.7 Flash vs GLM 5.1 benchmark তুলনা: average score প্রায় সমান: 7.1 vs 7.1. GLM 5.1-এর benchmark খরচ কম: $0.292 vs $1.148. GLM 5.1 দ্রুত: 33.67s vs 64.46s, pass rates 63.5% vs 68.3%.

প্রস্তাবিত মডেল: GLM 5.1 - It has the best score here (7.1), while costing about 3.9x less than Step 3.7 Flash.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29 GLM 5.1 GLM 5.1 medium প্রকাশ: 2026-04-07
স্কোর 7.1 7.1
র‍্যাঙ্ক #63 #64
নির্ভরযোগ্যতা 10.0 6.7
ধারাবাহিকতা 8.2 8.3
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.5% 68.3%
অস্থির টেস্ট 4 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 10.434 2.496
মোট খরচ $1.148 $0.292
ইনপুট মূল্য $0.200 / 1M $0.980 / 1M
আউটপুট মূল্য $1.150 / 1M $3.080 / 1M
মোট ইনপুট টোকেন 38,391 32,995
আউটপুট টোকেন 991,355 11,655
রিজনিং টোকেন 0 75,421
প্রতিক্রিয়া সময় (গড়) 64.46s 33.67s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 364.99s 172.60s
প্রতিক্রিয়া সময় (মোট) 1353.57s 673.41s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#63 Step 3.7 Flash

high
Cost
$0.007
Time
63.6s
Tokens
6,030 tok

#64 GLM 5.1

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
GLM 5.1 10.0 10.0 100.0% 0 8.31s 555 401 5,122
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.0 6.0 22.2% 1 206.21s 6,057 327,340 0
GLM 5.1 4.6 3.7 44.5% 2 109.63s 5,702 4,871 37,826
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
GLM 5.1 9.5 10.0 100.0% 0 43.11s 17,298 327 4,206
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
GLM 5.1 10.0 10.0 100.0% 0 9.33s 7,107 991 4,552
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
GLM 5.1 5.3 10.0 33.3% 0 29.77s 489 969 11,314
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
GLM 5.1 10.0 10.0 100.0% 0 20.95s 477 2,875 2,875
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
GLM 5.1 6.4 5.8 66.7% 1 7.47s 634 204 1,617
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
GLM 5.1 8.2 7.2 88.9% 1 31.64s 609 935 5,730
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
GLM 5.1 3.0 10.0 0.0% 0 0ms 0 0 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0
GLM 5.1 3.0 10.0 0.0% 0 29.40s 124 82 2,179

দ্রুত তুলনা

তুলনার জুটি বদলান