नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Google: Gemini 3.1 Flash Lite vs Inception: Mercury 2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-08

मेट्रिक Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none रिलीज़: 2026-05-08 Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24
स्कोर 6.7 6.3
रैंक #73 #80
विश्वसनीयता 10.0 10.0
संगति 8.4 8.7
सही परीक्षण
प्रति प्रयास पास दर 57.9% 50.9%
अस्थिर टेस्ट 4 3
कुल रन 57 57
प्रति परिणाम लागत 0.123 0.616
कुल लागत $0.012 $0.050
???? ??? $0.250 / 1M $0.250 / 1M
????? ??? $1.500 / 1M $0.750 / 1M
आउटपुट टोकन 2,454 3,994
रीजनिंग टोकन 0 52,081
प्रतिक्रिया समय (औसत) 1.11s 2.23s
प्रतिक्रिया समय (अधिकतम) 2.97s 14.63s
प्रतिक्रिया समय (कुल) 21.13s 40.10s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.59s 636 0
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
Mercury 2 3.8 7.3 22.2% 1 934ms 354 2,758
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748

त्वरित तुलना

तुलना जोड़ी बदलें