नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Inception: Mercury 2

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03

मेट्रिक Gemini 3 Flash Preview Gemini 3 Flash Preview medium प्रकाशन: 2025-12-17 Mercury 2 Mercury 2 medium प्रकाशन: 2026-02-24
स्कोअर 9.8 6.5
क्रमांक #1 #89
विश्वसनीयता 10.0 10.0
सुसंगतता 9.6 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 98.3% 51.7%
अस्थिर चाचण्या 1 3
एकूण रन 60 60
प्रति निकाल खर्च 2.980 0.611
एकूण खर्च $0.567 $0.055
इनपुट किंमत $0.500 / 1M $0.250 / 1M
आउटपुट किंमत $3.000 / 1M $0.750 / 1M
एकूण इनपुट टोकन्स 34,014 32,570
आउटपुट टोकन्स 2,000 4,022
रिझनिंग टोकन्स 181,033 58,405
प्रतिसाद वेळ (सरासरी) 16.50s 2.27s
प्रतिसाद वेळ (कमाल) 117.26s 14.63s
प्रतिसाद वेळ (एकूण) 330.06s 43.20s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 494 330 3,216
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 5,119 456 127,964
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 12,873 351 10,485
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 7,548 279 4,893
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 633 12 21,684
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 486 72 1,905
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 615 72 2,709
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 558 183 4,365
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 5,532 234 1,487
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 156 11 2,325
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748

झटपट तुलना

तुलना जोडी बदला