नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Lite vs Z.ai: GLM 5

सारांश

Seed-2.0-Lite vs GLM 5 benchmark तुलना: GLM 5 average score में आगे है: 8.6 vs 8.5. Seed-2.0-Lite की benchmark लागत कम है: $0.175 vs $0.228. GLM 5 तेज है: 33.54s vs 47.07s, pass rates 76.2% vs 82.5%.

अनुशंसित मॉडल: GLM 5 - It has the strongest score in this comparison (8.6) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Seed-2.0-Lite Seed-2.0-Lite medium रिलीज़: 2026-02-14 GLM 5 GLM 5 medium रिलीज़: 2026-02-12
स्कोर 8.5 8.6
रैंक #18 #15
विश्वसनीयता 10.0 10.0
संगति 9.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 76.2% 82.5%
अस्थिर टेस्ट 3 4
कुल रन 63 63
प्रति परिणाम लागत 1.250 1.668
कुल लागत $0.175 $0.228
इनपुट कीमत $0.250 / 1M $0.600 / 1M
आउटपुट कीमत $2.000 / 1M $1.920 / 1M
कुल इनपुट टोकन 46,740 35,224
आउटपुट टोकन 3,230 21,570
रीजनिंग टोकन 78,406 102,996
प्रतिक्रिया समय (औसत) 47.07s 33.54s
प्रतिक्रिया समय (अधिकतम) 254.92s 99.85s
प्रतिक्रिया समय (कुल) 988.37s 435.99s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium
लागत
$0.005
समय
86.7s
टोकन
2,354 tok

#15 GLM 5

medium
लागत
$0.005
समय
20.7s
टोकन
2,068 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 942 996 7,142
GLM 5 10.0 10.0 100.0% 0 23.66s 555 480 7,056
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 8.0 9.8 66.7% 0 156.74s 8,247 458 31,890
GLM 5 10.0 10.0 100.0% 0 74.30s 7,254 2,997 52,930
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 16,254 506 4,299
GLM 5 10.0 10.0 100.0% 0 28.96s 12,804 662 3,242
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 8,562 246 1,742
GLM 5 7.1 5.6 83.3% 1 8.90s 5,508 567 3,734
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 843 15 23,897
GLM 5 3.5 4.4 33.3% 2 0ms 260 13,176 14,137
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 582 304 1,620
GLM 5 6.1 3.1 66.7% 1 14.69s 477 2,020 2,248
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 834 71 1,480
GLM 5 10.0 10.0 100.0% 0 7.25s 636 1,001 2,129
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 9.0 7.9 88.9% 1 10.23s 894 403 3,285
GLM 5 10.0 10.0 100.0% 0 11.33s 609 33 4,076
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 9,306 222 1,011
GLM 5 10.0 10.0 100.0% 0 15.93s 6,935 233 994
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Lite 3.0 10.0 0.0% 0 48.32s 276 9 2,040
GLM 5 3.0 10.0 0.0% 0 67.37s 186 401 12,450

त्वरित तुलना

तुलना जोड़ी बदलें