नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.5 vs Z.ai: GLM 5.2

सारांश

GPT-5.5 vs GLM 5.2 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 8.7. GLM 5.2 की benchmark लागत कम है: $0.324 vs $0.907. GPT-5.5 तेज है: 9.76s vs 23.28s, pass rates 85.7% vs 84.1%.

अनुशंसित मॉडल: GPT-5.5 - It has the best score here (9.3), while responding about 2.4x faster than GLM 5.2.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-17

मेट्रिक GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24 GLM 5.2 GLM 5.2 medium रिलीज़: 2026-06-17
स्कोर 9.3 8.7
रैंक #4 #14
विश्वसनीयता 10.0 9.5
संगति 10.0 8.4
सही परीक्षण
प्रति प्रयास पास दर 85.7% 84.1%
अस्थिर टेस्ट 0 4
कुल रन 63 63
प्रति परिणाम लागत 5.035 2.159
कुल लागत $0.907 $0.324
इनपुट कीमत $5.000 / 1M $1.400 / 1M
आउटपुट कीमत $30.000 / 1M $4.400 / 1M
कुल इनपुट टोकन 34,209 37,199
आउटपुट टोकन 2,046 12,261
रीजनिंग टोकन 22,460 49,500
प्रतिक्रिया समय (औसत) 9.76s 23.28s
प्रतिक्रिया समय (अधिकतम) 56.19s 101.36s
प्रतिक्रिया समय (कुल) 204.92s 488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#4 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

#14 GLM 5.2

medium
Cost
$0.041
Time
195.8s
Tokens
9,287 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
GLM 5.2 10.0 10.0 100.0% 0 5.89s 639 497 2,634
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
GLM 5.2 8.2 7.2 88.9% 1 40.96s 7,317 1,475 17,123
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
GLM 5.2 10.0 10.0 100.0% 0 51.96s 12,696 458 4,531
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
GLM 5.2 10.0 10.0 100.0% 0 13.44s 7,149 348 2,345
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
GLM 5.2 4.1 4.4 44.5% 2 45.47s 551 8,188 11,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
GLM 5.2 10.0 10.0 100.0% 0 17.39s 498 54 1,842
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
GLM 5.2 9.9 10.0 100.0% 0 7.90s 678 94 1,518
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
GLM 5.2 8.2 7.2 88.9% 1 13.13s 672 536 4,822
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
GLM 5.2 10.0 10.0 100.0% 0 20.41s 6,861 230 550
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
GLM 5.2 3.0 10.0 0.0% 0 34.25s 138 381 2,529

त्वरित तुलना

तुलना जोड़ी बदलें