AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#153

Mercury 2

Inception प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-05-22 00:39 inception/mercury-2::none
(medium) (none)

सुसंगतता

9.1

एकूण आउटपुट टोकन्स

3,001

एकूण इनपुट टोकन्स

25,515

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$0.750 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 25.0%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

614ms

प्रतिसाद वेळ (कमाल): 1.27s

प्रतिसाद वेळ (एकूण): 12.28s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:39 सूट बदलला 4.6 10.0 $0.009 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 4.8 लागू नाही $0.007 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-03 21:35 $0.250 / 1M $0.750 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.0 10.0
कोडिंग 3.5 9.4
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 7.3 5.9
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 3.1 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स