AI BENCHY
Comparar Gráficos Metodologia
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#45

Trinity Large Preview

Arcee AI · Lançamento: 2026-01-27 · arcee-ai/trinity-large-preview::none

Custo por resultado

0.000

Consistência

9.6

Custo total

$0.000

Testes corretos

Testes errados: 11

Taxa de acerto por tentativa: 33.3%

Testes instáveis

1

Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).

Tempo de resposta (médio)

3.15s

Tempo de resposta (máx.): 8.91s

Tempo de resposta (total): 50.46s

Resposta incorreta: 9 Não seguiu as instruções: 2

Gráficos

Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.

Comparação rápida

Detalhamento por categoria

Categoria Pontuação média Consistência Testes corretos
Anti-AI Tricks 10.0 10.0
Combined 10.0 10.0
Data parsing and extraction 9.9 10.0
Domain specific 4.0 10.0
General Intelligence 3.0 9.9
Instructions following 3.5 6.7
Puzzle Solving 4.0 10.0
Tool Calling 10.0 10.0