नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3 Flash Preview vs Inception: Mercury 2

सारांश

Gemini 3 Flash Preview vs Mercury 2 benchmark तुलना: Mercury 2 average score में आगे है: 7.5 vs 7.4. Mercury 2 की benchmark लागत कम है: $0.058 vs $0.111. Mercury 2 तेज है: 2.24s vs 5.76s, pass rates 79.4% vs 54.0%.

अनुशंसित मॉडल: Gemini 3 Flash Preview - It has the best overall balance of score, reliability, cost, and response time in this comparison.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-12

मेट्रिक Gemini 3 Flash Preview Gemini 3 Flash Preview low रिलीज़: 2025-12-17 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 7.4 7.5
रैंक #53 #46
विश्वसनीयता 10.0 10.0
संगति 9.2 8.8
सही परीक्षण
प्रति प्रयास पास दर 79.4% 54.0%
अस्थिर टेस्ट 2 3
कुल रन 63 63
प्रति परिणाम लागत 0.689 0.578
कुल लागत $0.111 $0.058
इनपुट कीमत $0.500 / 1M $0.250 / 1M
आउटपुट कीमत $3.000 / 1M $0.750 / 1M
कुल इनपुट टोकन 36,769 35,116
आउटपुट टोकन 2,076 4,048
रीजनिंग टोकन 28,518 61,219
प्रतिक्रिया समय (औसत) 5.76s 2.24s
प्रतिक्रिया समय (अधिकतम) 14.72s 14.63s
प्रतिक्रिया समय (कुल) 120.93s 44.72s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemini 3 Flash Preview

low
Cost
$0.007
Time
12.1s
Tokens
2,289 tok

#46 Mercury 2

medium
Cost
$0.002
Time
2.1s
Tokens
1,702 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 500 281 3,082
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 5.8 7.2 44.4% 1 6.00s 8,122 456 7,421
Mercury 2 8.2 7.7 77.8% 1 2.04s 7,065 296 11,328
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 12,860 326 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 7,261 279 3,656
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 645 12 6,410
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 492 120 981
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 621 71 2,752
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.77s 562 288 3,168
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 5,550 234 415
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 2.75s 156 9 633
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

त्वरित तुलना

तुलना जोड़ी बदलें