AI BENCHY Compare
Arcee AI: Trinity Large Preview (free) vs MoonshotAI: Kimi K2.5
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-03
| मेट्रिक | Arcee AI: Trinity Large Preview (free) none प्रकाशन: 2026-01-27 मोफत उपलब्ध | MoonshotAI: Kimi K2.5 none प्रकाशन: 2026-01-27 |
|---|---|---|
| क्रमांक | #33 | #35 |
| सरासरी स्कोअर | 4.34 | 4.07 |
| सुसंगतता | 9.97 | 8.92 |
| प्रति निकाल खर्च | 0.000 | 0.232 |
| एकूण खर्च | $0.000 | $0.010 |
| बरोबर चाचण्या | 5/14 | 4/14 |
| प्रति प्रयत्न पास दर | 35.7% | 35.7% |
| अस्थिर चाचण्या | 0 | 2 |
| आउटपुट टोकन्स | 1,415 | 1,915 |
| रिझनिंग टोकन्स | 0 | 0 |
श्रेणीवार तपशील
| अँटी-एआय युक्त्या | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 1.00 | 10.00 | 0.0% | 0 | 587 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.67 | 7.86 | 11.1% | 1 | 363 | 0 |
| डेटा पार्सिंग आणि निष्कर्षण | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 9.88 | 10.00 | 100.0% | 0 | 186 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.50 | 5.81 | 83.3% | 1 | 995 | 0 |
| डोमेन-विशिष्ट | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 10.00 | 33.3% | 0 | 21 | 0 | |
| MoonshotAI: Kimi K2.5 | 4.00 | 10.00 | 33.3% | 0 | 29 | 0 |
| सूचनांचे पालन | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 2.00 | 9.79 | 0.0% | 0 | 63 | 0 | |
| MoonshotAI: Kimi K2.5 | 5.00 | 9.99 | 50.0% | 0 | 61 | 0 |
| Puzzle Solving | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 4.00 | 9.99 | 33.3% | 0 | 291 | 0 | |
| MoonshotAI: Kimi K2.5 | 2.00 | 9.92 | 0.0% | 0 | 247 | 0 |
| टूल कॉलिंग | स्कोअर | सुसंगतता | प्रति प्रयत्न पास दर | अस्थिर चाचण्या | बरोबर चाचण्या | आउटपुट टोकन्स | रिझनिंग टोकन्स |
|---|---|---|---|---|---|---|---|
| Arcee AI: Trinity Large Preview (free) | 10.00 | 10.00 | 100.0% | 0 | 267 | 0 | |
| MoonshotAI: Kimi K2.5 | 10.00 | 10.00 | 100.0% | 0 | 220 | 0 |
झटपट तुलना
तुलना जोडी बदला
Kimi K2.5nonevsGLM 4.7 FlashmediumTrinity Large Preview (free)noneमोफत उपलब्धvsGLM 4.7 FlashmediumKimi K2.5nonevsQwen3 Coder NextmediumTrinity Large Preview (free)noneमोफत उपलब्धvsQwen3 Coder NextmediumTrinity Large Preview (free)noneमोफत उपलब्धvsMiniMax M2.5mediumTrinity Large Preview (free)noneमोफत उपलब्धvsgpt-oss-120bmediumमोफत उपलब्धTrinity Large Preview (free)noneमोफत उपलब्धvsQwen3.5-FlashmediumTrinity Large Preview (free)noneमोफत उपलब्धvsGPT-5 NanomediumMiniMax M2.5mediumvsKimi K2.5noneKimi K2.5nonevsgpt-oss-120bmediumमोफत उपलब्धTrinity Large Preview (free)noneमोफत उपलब्धvsQwen3.5-35B-A3BmediumTrinity Large Preview (free)noneमोफत उपलब्धvsMiMo-V2-Flashmedium