नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 2.5 Flash vs Inception: Mercury 2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Gemini 2.5 Flash Gemini 2.5 Flash none रिलीज़: 2025-06-17 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 6.4 6.5
रैंक #94 #89
विश्वसनीयता 10.0 10.0
संगति 9.6 8.8
सही परीक्षण
प्रति प्रयास पास दर 48.3% 51.7%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 0.159 0.611
कुल लागत $0.015 $0.055
इनपुट कीमत $0.300 / 1M $0.250 / 1M
आउटपुट कीमत $2.500 / 1M $0.750 / 1M
कुल इनपुट टोकन 32,923 32,570
आउटपुट टोकन 1,764 4,022
रीजनिंग टोकन 0 58,405
प्रतिक्रिया समय (औसत) 889ms 2.27s
प्रतिक्रिया समय (अधिकतम) 4.39s 14.63s
प्रतिक्रिया समय (कुल) 17.79s 43.20s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 492 102 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 5,119 477 0
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 12,519 366 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 7,257 279 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 633 12 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 486 78 0
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 615 72 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 558 132 0
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 5,088 234 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 156 12 0
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

त्वरित तुलना

तुलना जोड़ी बदलें