AI BENCHY तुलना
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-03
| मेट्रिक | Arcee AI: Trinity Large Preview (free) none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध | MoonshotAI: Kimi K2.5 none रिलीज़: 2026-01-27 |
|---|---|---|
| रैंक | #33 | #35 |
| औसत स्कोर | 4.34 | 4.07 |
| संगति | 9.97 | 8.92 |
| प्रति परिणाम लागत | 0.000 | 0.232 |
| कुल लागत | $0.000 | $0.010 |
| सही परीक्षण | 5/14 | 4/14 |
| प्रति प्रयास पास दर | 35.7% | 35.7% |
| अस्थिर टेस्ट | 0 | 2 |
| आउटपुट टोकन | 1,415 | 1,915 |
| रीजनिंग टोकन | 0 | 0 |
श्रेणी विवरण
| एंटी-एआई ट्रिक्स | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| डेटा पार्सिंग और निष्कर्षण | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| डोमेन-विशिष्ट | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| निर्देश पालन | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| टूल कॉलिंग | स्कोर | संगति | प्रति प्रयास पास दर | अस्थिर टेस्ट | सही परीक्षण | आउटपुट टोकन | रीजनिंग टोकन |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
त्वरित तुलना
तुलना जोड़ी बदलें
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsQwen3 Coder NextmediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsMiniMax M2.5mediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsgpt-oss-120bmediumनिःशुल्क उपलब्धTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsQwen3.5-FlashmediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumनिःशुल्क उपलब्धTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneनिःशुल्क उपलब्धvsMiMo-V2-Flashmedium