नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Z.ai: GLM 5.2

सारांश

GPT-5.3 Chat vs GLM 5.2 benchmark तुलना: GLM 5.2 average score में आगे है: 8.7 vs 7.5. GLM 5.2 की benchmark लागत कम है: $0.324 vs $0.433. GPT-5.3 Chat तेज है: 6.34s vs 23.28s, pass rates 66.7% vs 84.1%.

अनुशंसित मॉडल: GLM 5.2 - It has the strongest score in this comparison (8.7) and the best overall balance of cost and response time across all 2 models.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 GLM 5.2 GLM 5.2 medium रिलीज़: 2026-06-17
स्कोर 7.5 8.7
रैंक #45 #14
विश्वसनीयता 10.0 9.5
संगति 8.1 8.4
सही परीक्षण
प्रति प्रयास पास दर 66.7% 84.1%
अस्थिर टेस्ट 5 4
कुल रन 63 63
प्रति परिणाम लागत 3.605 2.159
कुल लागत $0.433 $0.324
इनपुट कीमत $1.750 / 1M $1.400 / 1M
आउटपुट कीमत $14.000 / 1M $4.400 / 1M
कुल इनपुट टोकन 34,209 37,199
आउटपुट टोकन 26,617 12,261
रीजनिंग टोकन 0 49,500
प्रतिक्रिया समय (औसत) 6.34s 23.28s
प्रतिक्रिया समय (अधिकतम) 18.33s 101.36s
प्रतिक्रिया समय (कुल) 133.13s 488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#45 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

#14 GLM 5.2

medium
Cost
$0.041
Time
195.8s
Tokens
9,287 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
GLM 5.2 10.0 10.0 100.0% 0 5.89s 639 497 2,634
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
GLM 5.2 8.2 7.2 88.9% 1 40.96s 7,317 1,475 17,123
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
GLM 5.2 10.0 10.0 100.0% 0 51.96s 12,696 458 4,531
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
GLM 5.2 10.0 10.0 100.0% 0 13.44s 7,149 348 2,345
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
GLM 5.2 4.1 4.4 44.5% 2 45.47s 551 8,188 11,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
GLM 5.2 10.0 10.0 100.0% 0 17.39s 498 54 1,842
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
GLM 5.2 9.9 10.0 100.0% 0 7.90s 678 94 1,518
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
GLM 5.2 8.2 7.2 88.9% 1 13.13s 672 536 4,822
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
GLM 5.2 10.0 10.0 100.0% 0 20.41s 6,861 230 550
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
GLM 5.2 3.0 10.0 0.0% 0 34.25s 138 381 2,529

त्वरित तुलना

तुलना जोड़ी बदलें