नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Arcee AI: Trinity Large Preview vs Mistral: Mistral Small 4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Trinity Large Preview Trinity Large Preview none रिलीज़: 2026-01-27 Mistral Small 4 Mistral Small 4 none रिलीज़: 2026-03-16
स्कोर 5.3 5.2
रैंक #102 #109
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.6 9.5
सही परीक्षण
प्रति प्रयास पास दर 29.6% 31.5%
अस्थिर टेस्ट 1 1
कुल रन 52 54
प्रति परिणाम लागत 0.000 0.118
कुल लागत $0.000 $0.006
???? ??? $0.150 / 1M $0.150 / 1M
????? ??? $0.450 / 1M $0.600 / 1M
आउटपुट टोकन 1,985 2,207
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 5.07s 665ms
प्रतिक्रिया समय (अधिकतम) 39.47s 1.72s
प्रतिक्रिया समय (कुल) 91.23s 11.97s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
Mistral Small 4 4.5 9.0 0.0% 0 1.28s 583 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
Mistral Small 4 3.1 9.9 0.0% 0 589ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0

त्वरित तुलना

तुलना जोड़ी बदलें