#85
Arcee AI
प्रकाशन: 2026-01-27
चाचणी तारीख: 2026-04-23 10:54
arcee-ai/trinity-large-preview::none
5.3
सुसंगतता
9.6
लागू नाही
$0.000
एकूण आउटपुट टोकन्स
1,985
एकूण इनपुट टोकन्स
0
इनपुट किंमत
$0.150 / 1M
आउटपुट किंमत
$0.450 / 1M
अस्थिर चाचण्या
1
अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).
रन इतिहास
| चाचणी तारीख | स्कोअर | विश्वसनीयता | बरोबर चाचण्या | एकूण खर्च | तुलना करा |
|---|---|---|---|---|---|
| 2026-05-22 00:42 सूट बदलला | 4.8 | 10.0 | $0.001 | तुलना करा | |
| 2026-05-08 15:30 सूट बदलला | 4.8 | 10.0 | $0.001 | तुलना करा | |
| 2026-04-23 10:54 पहिली नोंदलेली रन | 5.3 | लागू नाही | $0.000 | सध्याची रन |
रन तुलना
| रन | स्कोअर | सुसंगतता | विश्वसनीयता | बरोबर चाचण्या | अस्थिर चाचण्या | एकूण आउटपुट टोकन्स | एकूण इनपुट टोकन्स | एकूण खर्च | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-23 10:54 · पहिली नोंदलेली रन | 5.3 | 9.6 | लागू नाही | 5/18 | 1 | 1,985 | 0 | $0.000 | 5.07s |
| 2026-05-08 15:30 · सूट बदलला | 4.8 | 8.9 | 10.0 | 4/19 | 3 | 2,190 | 0 | $0.001 | 3.03s |
| फरक | +0.6 | +0.7 | +1 | -2 | -205 | 0 | -$0.001 | +2037ms |
या दोन रनमध्ये वेगवेगळे बेंचमार्क सूट वापरले गेले, त्यामुळे फरकांमध्ये मॉडेलमधील आणि सूटमधील दोन्ही बदल दिसतात.
चार्ट्स
पहिले मॉडेल निवडा, नंतर दुसरे मॉडेल क्लिक करून बाजू-बाजूची तुलना पेज उघडा.
स्कोअर vs एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
झटपट तुलना
Trinity Large PreviewnonevsMiniMax M2.7mediumTrinity Large PreviewnonevsDeepSeek V3.2noneTrinity Large PreviewnonevsGrok 4.20noneTrinity Large PreviewnonevsQwen3.5-122B-A10BnoneTrinity Large Previewnonevsgpt-oss-120bnoneमोफत उपलब्धTrinity Large PreviewnonevsGLM 5 TurbononeTrinity Large PreviewnonevsGemini 3 Flash PreviewmediumTrinity Large PreviewnonevsGemini 3.5 FlashhighTrinity Large PreviewnonevsRing-2.6-1TmediumTrinity Large PreviewnonevsGemini 3.5 Flashlow
श्रेणीवार तपशील
| श्रेणी | स्कोअर | सुसंगतता | बरोबर चाचण्या |
|---|---|---|---|
| अँटी-एआय युक्त्या | 3.0 | 10.0 | |
| कोडिंग | 6.3 | 10.0 | |
| संयुक्त | 3.0 | 10.0 | |
| डेटा पार्सिंग आणि निष्कर्षण | 10.0 | 10.0 | |
| डोमेन-विशिष्ट | 5.3 | 10.0 | |
| Samanya Buddhimatta | 4.4 | 9.9 | |
| सूचनांचे पालन | 4.1 | 6.7 | |
| कोडी सोडवणे | 5.4 | 10.0 | |
| टूल कॉलिंग | 10.0 | 10.0 |