नेविगेशन
AI BENCHY
तुलना करें चार्ट
❤️ Made by XCS
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs OpenAI: GPT-5 Nano

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-05

मेट्रिक Inception: Mercury 2 none रिलीज़: 2026-02-24 OpenAI: GPT-5 Nano medium रिलीज़: 2025-08-07
रैंक #50 #34
औसत स्कोर 3.4 5.7
सही परीक्षण
संगति 8.9 6.8
प्रति परिणाम लागत 0.147 0.829
कुल लागत $0.006 $0.058
प्रति प्रयास पास दर 33.3% 64.4%
अस्थिर टेस्ट 2 6
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
आउटपुट टोकन 1,144 4,184
रीजनिंग टोकन 0 137,472
प्रतिक्रिया समय (औसत) 594ms 51.74s
प्रतिक्रिया समय (अधिकतम) 1.27s 204.02s
प्रतिक्रिया समय (कुल) 8.91s 413.95s

स्कोर के अनुसार शीर्ष मॉडल

प्रतिक्रिया समय (औसत)

स्कोर बनाम कुल लागत

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
OpenAI: GPT-5 Nano 7.0 10.0 66.7% 0 37.73s 1,107 19,968
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
OpenAI: GPT-5 Nano 10.0 1.7 50.0% 2 21.42s 453 10,560
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
OpenAI: GPT-5 Nano 4.0 4.4 55.6% 2 204.02s 237 64,448
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
OpenAI: GPT-5 Nano 9.0 6.8 83.3% 1 11.90s 382 4,096
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
OpenAI: GPT-5 Nano 4.0 7.2 44.4% 1 19.81s 869 13,440
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Inception: Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
OpenAI: GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976

त्वरित तुलना

तुलना जोड़ी बदलें