नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs Inception: Mercury 2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03

मेट्रिक Gemini 3 Flash Preview Gemini 3 Flash Preview medium रिलीज़: 2025-12-17 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 9.8 6.5
रैंक #1 #89
विश्वसनीयता 10.0 10.0
संगति 9.6 8.8
सही परीक्षण
प्रति प्रयास पास दर 98.3% 51.7%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 2.980 0.611
कुल लागत $0.567 $0.055
इनपुट कीमत $0.500 / 1M $0.250 / 1M
आउटपुट कीमत $3.000 / 1M $0.750 / 1M
कुल इनपुट टोकन 34,014 32,570
आउटपुट टोकन 2,000 4,022
रीजनिंग टोकन 181,033 58,405
प्रतिक्रिया समय (औसत) 16.50s 2.27s
प्रतिक्रिया समय (अधिकतम) 117.26s 14.63s
प्रतिक्रिया समय (कुल) 330.06s 43.20s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 5,119 456 127,964
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

त्वरित तुलना

तुलना जोड़ी बदलें