नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs OpenAI: GPT-5.4 Nano

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 GPT-5.4 Nano GPT-5.4 Nano none रिलीज़: 2026-03-17
स्कोर 4.8 4.5
रैंक #121 #128
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.0 7.1
सही परीक्षण
प्रति प्रयास पास दर 27.8% 31.5%
अस्थिर टेस्ट 2 7
कुल रन 54 54
प्रति परिणाम लागत 0.165 0.448
कुल लागत $0.007 $0.009
???? ??? $0.250 / 1M $0.200 / 1M
????? ??? $0.750 / 1M $1.250 / 1M
आउटपुट टोकन 1,625 2,762
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 613ms 1.40s
प्रतिक्रिया समय (अधिकतम) 1.27s 3.84s
प्रतिक्रिया समय (कुल) 11.04s 25.14s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
GPT-5.4 Nano 3.5 8.0 16.7% 1 1.18s 800 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
GPT-5.4 Nano 7.1 3.7 66.7% 1 1.43s 577 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 3.84s 280 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
GPT-5.4 Nano 6.5 10.0 50.0% 0 1.11s 219 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
GPT-5.4 Nano 2.9 4.4 22.2% 2 926ms 52 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
GPT-5.4 Nano 3.8 2.5 33.3% 1 1.31s 180 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
GPT-5.4 Nano 5.0 6.8 33.3% 1 787ms 84 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
GPT-5.4 Nano 3.7 7.3 22.2% 1 1.29s 348 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 3.40s 222 0

त्वरित तुलना

तुलना जोड़ी बदलें