नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemma 4 31B vs Inception: Mercury 2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 6.7 6.3
रैंक #47 #51
संगति 10.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 52.9% 51.0%
अस्थिर टेस्ट 0 3
कुल रन 51 51
प्रति परिणाम लागत 0.023 0.634
कुल लागत $0.002 $0.045
???? ??? $0.140 / 1M $0.250 / 1M
????? ??? $0.400 / 1M $0.750 / 1M
आउटपुट टोकन 660 3,723
रीजनिंग टोकन 0 46,120
प्रतिक्रिया समय (औसत) 2.55s 2.25s
प्रतिक्रिया समय (अधिकतम) 4.68s 14.63s
प्रतिक्रिया समय (कुल) 38.20s 35.99s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

त्वरित तुलना

तुलना जोड़ी बदलें