नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.5 vs OpenAI: GPT-5.5

सारांश

GPT-5.5 vs GPT-5.5 benchmark तुलना: GPT-5.5 average score में आगे है: 9.0 vs 8.8. GPT-5.5 की benchmark लागत कम है: $0.907 vs $3.679. GPT-5.5 तेज है: 9.76s vs 37.98s, pass rates 85.7% vs 87.3%.

अनुशंसित मॉडल: GPT-5.5 - It has the best score here (9.0), while costing about 4.1x less than GPT-5.5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक GPT-5.5 GPT-5.5 low रिलीज़: 2026-04-24 GPT-5.5 GPT-5.5 medium रिलीज़: 2026-04-24
स्कोर 9.0 8.8
रैंक #6 #9
विश्वसनीयता 10.0 10.0
संगति 10.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 85.7% 87.3%
अस्थिर टेस्ट 0 3
कुल रन 63 63
प्रति परिणाम लागत 5.035 21.638
कुल लागत $0.907 $3.679
इनपुट कीमत $5.000 / 1M $5.000 / 1M
आउटपुट कीमत $30.000 / 1M $30.000 / 1M
कुल इनपुट टोकन 34,209 34,212
आउटपुट टोकन 2,046 1,985
रीजनिंग टोकन 22,460 114,925
प्रतिक्रिया समय (औसत) 9.76s 37.98s
प्रतिक्रिया समय (अधिकतम) 56.19s 332.10s
प्रतिक्रिया समय (कुल) 204.92s 797.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#6 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

#9 GPT-5.5

medium
Cost
$0.112
Time
71.9s
Tokens
3,807 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
GPT-5.5 10.0 10.0 100.0% 0 4.66s 606 250 1,335
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
GPT-5.5 8.8 7.8 88.9% 1 59.77s 7,305 362 24,959
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
GPT-5.5 10.0 10.0 100.0% 0 19.29s 11,019 312 2,841
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
GPT-5.5 10.0 10.0 100.0% 0 4.18s 7,140 234 593
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
GPT-5.5 5.3 7.2 44.4% 1 164.14s 723 67 79,625
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
GPT-5.5 10.0 10.0 100.0% 0 4.16s 477 138 223
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
GPT-5.5 10.0 10.0 100.0% 0 3.36s 660 93 538
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
GPT-5.5 10.0 10.0 100.0% 0 6.76s 642 241 2,225
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
GPT-5.5 10.0 10.0 100.0% 0 10.57s 5,445 258 832
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
GPT-5.5 2.8 1.6 33.3% 1 37.86s 195 30 1,754

त्वरित तुलना

तुलना जोड़ी बदलें