AI BENCHY
Advertise here

#89

Mercury 2

Inception प्रकाशन: 2026-02-24 चाचणी तारीख: 2026-05-22 00:40 inception/mercury-2::medium
(medium) (none)

सुसंगतता

8.8

एकूण आउटपुट टोकन्स

62,427

एकूण इनपुट टोकन्स

32,570

इनपुट किंमत

$0.250 / 1M

आउटपुट किंमत

$0.750 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 11

प्रति प्रयत्न पास दर: 51.7%

अस्थिर चाचण्या

3

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.27s

प्रतिसाद वेळ (कमाल): 14.63s

प्रतिसाद वेळ (एकूण): 43.20s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:40 पुन्हा चाचणी 6.3 10.0 $0.055 सध्याची रन
2026-04-11 01:44 पहिली नोंदलेली रन 6.5 लागू नाही $0.047 तुलना करा

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:40 · सध्याची रन6.58.810.09/20362,42732,570$0.0552.27s
2026-04-11 01:44 · पहिली नोंदलेली रन6.58.6लागू नाही8/18352,3050$0.0472.21s
फरक0.0+0.2+10+10122+32570+$0.009+67ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-03 21:35 $0.250 / 1M $0.750 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 6.9 9.9
कोडिंग 7.2 6.5
संयुक्त 10.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 7.3 5.9
डोमेन-विशिष्ट 2.9 7.2
Samanya Buddhimatta 4.8 10.0
सूचनांचे पालन 10.0 10.0
कोडी सोडवणे 5.4 10.0
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स