AI BENCHY
Advertise here

#148

Trinity Large Preview

Arcee AI प्रकाशन: 2026-01-27 चाचणी तारीख: 2026-05-22 00:42 arcee-ai/trinity-large-preview::none

सुसंगतता

9.3

एकूण खर्च (सध्याची किंमत)

$0.008 ↑ +1047.8%

या किमतीवर चाचणी केली: $0.001

एकूण आउटपुट टोकन्स

2,169

एकूण इनपुट टोकन्स

29,828

इनपुट किंमत

$0.243 / 1M

आउटपुट किंमत

$0.243 / 1M

बरोबर चाचण्या

चुकीच्या चाचण्या: 16

प्रति प्रयत्न पास दर: 23.3%

अस्थिर चाचण्या

2

अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).

प्रतिसाद वेळ (सरासरी)

2.98s

प्रतिसाद वेळ (कमाल): 14.34s

प्रतिसाद वेळ (एकूण): 56.57s

रन इतिहास

चाचणी तारीख स्कोअर विश्वसनीयता बरोबर चाचण्या एकूण खर्च तुलना करा
2026-05-22 00:42 सूट बदलला 4.8 10.0 $0.001 सध्याची रन
2026-05-08 15:30 सूट बदलला 4.8 10.0 $0.001 तुलना करा
2026-04-23 10:54 पहिली नोंदलेली रन 5.3 लागू नाही $0.000 तुलना करा

या रनमध्ये वेगळा बेंचमार्क सूट वापरला गेला. ऐतिहासिक बदल वाचताना सूटमधील बदल लक्षात घ्या.

रन तुलना

रनस्कोअरसुसंगतताविश्वसनीयताबरोबर चाचण्याअस्थिर चाचण्याएकूण आउटपुट टोकन्सएकूण इनपुट टोकन्सएकूण खर्चप्रतिसाद वेळ (सरासरी)
2026-05-22 00:42 · सध्याची रन4.79.310.04/2022,16929,828$0.0012.98s
2026-04-23 10:54 · पहिली नोंदलेली रन5.39.6लागू नाही5/1811,9850$0.0005.07s
फरक-0.6-0.3-1+1+184+29828+$0.001-2091ms

या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.

किंमत इतिहास

OpenRouter मधील या मॉडेलचा ऐतिहासिक किंमत डेटा.

तारीख इनपुट किंमत आउटपुट किंमत
2026-06-03 21:35 $0.243 / 1M $0.243 / 1M

चार्ट्स

पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

झटपट तुलना

श्रेणीवार तपशील

श्रेणी स्कोअर सुसंगतता बरोबर चाचण्या
अँटी-एआय युक्त्या 3.1 10.0
कोडिंग 4.0 6.6
संयुक्त 3.0 10.0
डेटा पार्सिंग आणि निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 5.3 10.0
Samanya Buddhimatta 4.5 10.0
सूचनांचे पालन 3.5 10.0
कोडी सोडवणे 3.6 7.7
टूल कॉलिंग 10.0 10.0
सामान्य ज्ञान 3.0 10.0

तुलना केलेली मॉडेल्स