नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.2 Chat vs OpenAI: GPT-5.5

सारांश

GPT-5.2 Chat vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.3 vs 8.5. GPT-5.2 Chat की benchmark लागत कम है: $0.393 vs $0.907. GPT-5.2 Chat तेज है: 7.13s vs 9.76s, pass rates 74.6% vs 85.7%.

अनुशंसित मॉडल: GPT-5.2 Chat - It offers the best overall trade-off: a competitive score (8.5), lower cost than GPT-5.5, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-18

मेट्रिक GPT-5.2 Chat GPT-5.2 Chat none रिलीज़: 2025-12-11 GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24
स्कोर 8.5 9.3
रैंक #19 #4
विश्वसनीयता 10.0 10.0
संगति 8.9 10.0
सही परीक्षण
प्रति प्रयास पास दर 74.6% 85.7%
अस्थिर टेस्ट 3 0
कुल रन 63 63
प्रति परिणाम लागत 2.803 5.035
कुल लागत $0.393 $0.907
इनपुट कीमत $1.750 / 1M $5.000 / 1M
आउटपुट कीमत $14.000 / 1M $30.000 / 1M
कुल इनपुट टोकन 34,212 34,209
आउटपुट टोकन 23,744 2,046
रीजनिंग टोकन 0 22,460
प्रतिक्रिया समय (औसत) 7.13s 9.76s
प्रतिक्रिया समय (अधिकतम) 38.52s 56.19s
प्रतिक्रिया समय (कुल) 149.69s 204.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#19 GPT-5.2 Chat

none
लागत
$0.010
समय
15.3s
टोकन
797 tok

#4 GPT-5.5

low
लागत
$0.068
समय
37.0s
टोकन
2,339 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840

त्वरित तुलना

तुलना जोड़ी बदलें