नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Z.ai: GLM 5 Turbo

सारांश

Claude Sonnet 4.6 vs GLM 5 Turbo benchmark तुलना: GLM 5 Turbo average score में आगे है: 8.4 vs 7.3. Claude Sonnet 4.6 की benchmark लागत कम है: $0.316 vs $0.323. Claude Sonnet 4.6 तेज है: 5.04s vs 23.00s, pass rates 55.6% vs 74.6%.

अनुशंसित मॉडल: Claude Sonnet 4.6 - It offers the best overall trade-off: a competitive score (7.3), lower cost than GLM 5 Turbo, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 GLM 5 Turbo GLM 5 Turbo medium रिलीज़: 2026-03-15
स्कोर 7.3 8.4
रैंक #56 #24
विश्वसनीयता 10.0 10.0
संगति 9.7 8.5
सही परीक्षण
प्रति प्रयास पास दर 55.6% 74.6%
अस्थिर टेस्ट 1 4
कुल रन 63 63
प्रति परिणाम लागत 2.870 2.011
कुल लागत $0.316 $0.323
इनपुट कीमत $3.000 / 1M $1.200 / 1M
आउटपुट कीमत $15.000 / 1M $4.000 / 1M
कुल इनपुट टोकन 57,886 35,593
आउटपुट टोकन 9,465 12,245
रीजनिंग टोकन 0 62,277
प्रतिक्रिया समय (औसत) 5.04s 23.00s
प्रतिक्रिया समय (अधिकतम) 23.84s 194.23s
प्रतिक्रिया समय (कुल) 70.60s 482.97s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#24 GLM 5 Turbo

medium
Cost
$0.074
Time
206.0s
Tokens
18,549 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 555 362 3,137
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GLM 5 Turbo 8.2 9.3 66.7% 0 45.90s 5,941 363 25,381
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 12,714 390 2,037
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 7,107 577 3,632
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 489 9,665 19,279
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 477 60 2,216
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 636 255 2,183
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GLM 5 Turbo 8.7 7.9 77.8% 1 5.23s 609 312 2,647
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 6,879 241 446
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GLM 5 Turbo 3.0 10.0 0.0% 0 40.17s 186 20 1,319

त्वरित तुलना

तुलना जोड़ी बदलें