नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: GPT-5.4 vs StepFun: Step 3.7 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05 Step 3.7 Flash Step 3.7 Flash high रिलीज़: 2026-05-29
स्कोर 7.9 7.2
रैंक #27 #66
विश्वसनीयता 10.0 10.0
संगति 8.5 8.6
सही परीक्षण
प्रति प्रयास पास दर 75.0% 63.3%
अस्थिर टेस्ट 4 3
कुल रन 60 60
प्रति परिणाम लागत 8.765 8.723
कुल लागत $1.140 $0.960
इनपुट कीमत $2.500 / 1M $0.200 / 1M
आउटपुट कीमत $15.000 / 1M $1.150 / 1M
कुल इनपुट टोकन 31,489 35,763
आउटपुट टोकन 2,221 828,084
रीजनिंग टोकन 68,486 0
प्रतिक्रिया समय (औसत) 22.31s 49.43s
प्रतिक्रिया समय (अधिकतम) 100.41s 192.75s
प्रतिक्रिया समय (कुल) 446.17s 988.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.3 10.0 75.0% 0 4.11s 606 240 1,511
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 696 42,656 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 6.7 83.3% 1 54.98s 4,686 412 19,995
Step 3.7 Flash 3.7 8.3 0.0% 0 126.82s 3,429 164,069 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 20.57s 11,019 301 3,543
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 13,638 8,802 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 5.32s 7,140 234 804
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 7,368 23,113 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 74.27s 619 61 34,748
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 783 410,502 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.7 3.1 33.3% 1 4.92s 477 145 321
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 510 2,862 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 3.11s 660 93 897
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 705 2,010 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 8.2 7.2 88.9% 1 9.14s 642 441 3,815
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 711 25,422 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 13.28s 5,445 264 1,031
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 7,701 1,172 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 13.95s 195 30 1,821
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 222 147,476 0

त्वरित तुलना

तुलना जोड़ी बदलें