AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI · रिलीज़: 2026-01-27 · arcee-ai/trinity-large-preview::none

प्रति परिणाम लागत

0.000

संगति

9.6

सही परीक्षण

गलत टेस्ट: 11

प्रति प्रयास पास दर: 33.3%

अस्थिर टेस्ट

1

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

3.15s

प्रतिक्रिया समय (अधिकतम): 8.91s

प्रतिक्रिया समय (कुल): 50.46s

गलत उत्तर: 9 निर्देशों का पालन नहीं किया: 2

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

त्वरित तुलना

श्रेणी विवरण

श्रेणी औसत स्कोर संगति सही परीक्षण
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0