नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs OpenAI: GPT-5.4 Mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 GPT-5.4 Mini GPT-5.4 Mini none रिलीज़: 2026-03-17
स्कोर 4.8 5.1
रैंक #89 #84
संगति 9.0 8.6
सही परीक्षण
प्रति प्रयास पास दर 27.8% 35.2%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 0.165 0.630
कुल लागत $0.007 $0.032
???? ??? $0.250 / 1M $0.750 / 1M
????? ??? $0.750 / 1M $4.500 / 1M
आउटपुट टोकन 1,625 2,418
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 613ms 1.17s
प्रतिक्रिया समय (अधिकतम) 1.27s 2.52s
प्रतिक्रिया समय (कुल) 11.04s 21.01s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.19s 333 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

त्वरित तुलना

तुलना जोड़ी बदलें