AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#153

Mercury 2

Inception प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-05-22 00:39 inception/mercury-2::none
(medium) (none)

सुसंगतता

9.1

एकूण आउटपुट टोकन्स

3,001

एकूण इनपुट टोकन्स

25,515

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$0.750 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 25.0%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

614ms

प्रतिसाद वेळ (कमाल): 1.27s

प्रतिसाद वेळ (एकूण): 12.28s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:39 सूट बदलला 4.6 10.0 $0.009 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 4.8 लागू नाही $0.007 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:39 · सध्याची रन4.69.110.04/2023,00125,515$0.009614ms
2026-04-11 01:44 · पहिली नोंदलेली रन4.89.0लागू नाही4/1821,6250$0.007613ms
फरक-0.2+0.100+1376+25515+$0.003+1ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-03 21:35 $0.250 / 1M $0.750 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.0 10.0
कोडिंग 3.5 9.4
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 7.3 5.9
डोमेन-विशिष्ट 5.3 7.2
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 6.5 10.0
कोडी सोडवणे 3.1 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स