नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 GPT-5 Nano GPT-5 Nano medium रिलीज़: 2025-08-07
स्कोर 4.8 6.3
रैंक #89 #56
संगति 9.0 6.5
सही परीक्षण
प्रति प्रयास पास दर 27.8% 59.3%
अस्थिर टेस्ट 2 8
कुल रन 54 54
प्रति परिणाम लागत 0.165 0.942
कुल लागत $0.007 $0.066
???? ??? $0.250 / 1M $0.050 / 1M
????? ??? $0.750 / 1M $0.400 / 1M
आउटपुट टोकन 1,625 4,980
रीजनिंग टोकन 0 156,288
प्रतिक्रिया समय (औसत) 613ms 44.13s
प्रतिक्रिया समय (अधिकतम) 1.27s 204.02s
प्रतिक्रिया समय (कुल) 11.04s 485.47s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
GPT-5 Nano 6.7 3.5 66.7% 1 40.73s 480 12,992
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
GPT-5 Nano 8.5 6.8 83.3% 1 11.90s 382 4,096
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

त्वरित तुलना

तुलना जोड़ी बदलें