#148

GLM 4.7 Flash

Z.ai প্রকাশ: 2026-01-19 পরীক্ষিত হয়েছে: 2026-05-21 23:50 z-ai/glm-4.7-flash::medium

(medium) (none)

সারাংশ

GLM 4.7 Flash AI BENCHY-তে 4.5 স্কোর করে এবং #148 স্থানে আছে। এর reliability 8.3, pass rate 35.0%, মোট খরচ $0.054, এবং গড় response time 35.09s.

স্কোর

4.5

ধারাবাহিকতা

6.7

নির্ভরযোগ্যতা

8.3

মোট খরচ (বর্তমান মূল্য)

$0.054

মোট আউটপুট টোকেন

132,820

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.060 / 1M

আউটপুট মূল্য

$0.400 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 16

প্রতি চেষ্টায় পাস রেট: 35.0%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

35.09s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 174.55s

প্রতিক্রিয়া সময় (মোট): 456.18s

ভুল উত্তর: 9 কোন উত্তর নেই: 3 নির্দেশনা অনুসরণ করা হয়নি: 2 অবৈধ টুল কল: 1 টাইমআউট: 1

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#148 GLM 4.7 Flash

medium

অবৈধ SVG

খরচ: $0.000
সময়: 186.2s
টোকেন: 12,112 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-06-04 13:29 নতুন টেস্ট যোগ হয়েছে	4.4	6.7	$0.054	তুলনা করুন
2026-05-21 23:50 স্যুইট পরিবর্তিত হয়েছে	4.5	8.3	$0.054	বর্তমান রান
2026-04-11 01:19 প্রথম নথিভুক্ত রান	4.6	প্রযোজ্য নয়	$0.046	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GLM 4.7 FlashmediumvsDeepSeek V3.2none GLM 4.7 FlashmediumvsQwen3.6 35B A3Bnone GLM 4.7 FlashmediumvsQwen3.5-122B-A10Bnone GLM 4.7 FlashmediumvsMistral Small 4none GLM 4.7 FlashmediumvsGPT-5.4 Mininone GLM 4.7 FlashmediumvsQwen3 Coder Nextnone GLM 4.7 FlashmediumvsGemini 3.5 Flashhigh GLM 4.7 FlashmediumvsGemini 3 Flash Previewmedium GLM 4.7 FlashmediumvsNemotron 3 Ultra 550b A55bmediumবিনামূল্যে উপলভ্য GLM 4.7 FlashmediumvsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	4.7	5.9
কোডিং	3.4	6.0
সমন্বিত	2.8	2.1
ডেটা পার্সিং ও নিষ্কাশন	6.3	10.0
ডোমেইন-নির্দিষ্ট	3.5	4.4
Sadharon Buddhimotta	3.6	9.7
নির্দেশনা অনুসরণ	6.2	5.8
ধাঁধা সমাধান	2.9	7.2
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

GLM 4.7 Flash

Hamster playing table tennis

#148 GLM 4.7 Flash

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল