नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Nemotron 3 Super 120b A12b

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none रिलीज़: 2026-03-11 निःशुल्क उपलब्ध
रैंक #40 #59
औसत स्कोर 5.3 3.4
संगति 8.4 8.6
प्रति परिणाम लागत 0.631 0.000
कुल लागत $0.045 $0.000
सही परीक्षण
प्रति प्रयास पास दर 54.2% 31.3%
अस्थिर टेस्ट 3 3
कुल रन 48 48
आउटपुट टोकन 3,708 4,222
रीजनिंग टोकन 45,921 0
प्रतिक्रिया समय (औसत) 2.36s 8.90s
प्रतिक्रिया समय (अधिकतम) 14.63s 24.97s
प्रतिक्रिया समय (कुल) 35.39s 142.40s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.0 10.0 0.0% 0 821ms 137 542
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0

त्वरित तुलना

तुलना जोड़ी बदलें