#45
Arcee AI · اجرا: 2026-01-27 · arcee-ai/trinity-large-preview::none
غیر مستحکم ٹیسٹ
1
غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).
غلط جواب: 9 ہدایات پر عمل نہیں کیا: 2
چارٹس
پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔
فوری موازنہ
Trinity Large Previewnoneمفت دستیابvsGPT-5.4noneTrinity Large Previewnoneمفت دستیابvsKimi K2.5noneTrinity Large Previewnoneمفت دستیابvsMiniMax M2.5mediumTrinity Large Previewnoneمفت دستیابvsGPT-4o-mininoneTrinity Large Previewnoneمفت دستیابvsQwen3.5-35B-A3BnoneTrinity Large Previewnoneمفت دستیابvsQwen3 Coder NextnoneTrinity Large Previewnoneمفت دستیابvsGemini 3 Flash PreviewmediumTrinity Large Previewnoneمفت دستیابvsGemini 3.1 Pro PreviewmediumTrinity Large Previewnoneمفت دستیابvsStep 3.5 Flashmediumمفت دستیاب
زمرہ وار تفصیل
| زمرہ | اوسط اسکور | تسلسل | درست ٹیسٹس |
|---|---|---|---|
| Anti-AI Tricks | 10.0 | 10.0 | |
| Combined | 10.0 | 10.0 | |
| Data parsing and extraction | 9.9 | 10.0 | |
| Domain specific | 4.0 | 10.0 | |
| General Intelligence | 3.0 | 9.9 | |
| Instructions following | 3.5 | 6.7 | |
| Puzzle Solving | 4.0 | 10.0 | |
| Tool Calling | 10.0 | 10.0 |