AI BENCHY
Сравнить Графики Методология
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI · Релиз: 2026-01-27 · arcee-ai/trinity-large-preview::none

Стоимость за результат

0.000

Стабильность

9.6

Тестов верно

Ошибочных тестов: 11

Доля успешных попыток: 33.3%

Нестабильные тесты

1

Нестабильные тесты имели смешанные результаты между прогонами (как минимум один успех и один провал).

Время ответа (среднее)

3.15s

Время ответа (макс.): 8.91s

Время ответа (суммарно): 50.46s

Неверный ответ: 9 Не соблюдены инструкции: 2

Графики

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0