Navegação
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Arcee AI: Trinity Large Preview (free) vs Inception: Mercury 2

Comparar:

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-03-05

Métrica Arcee AI: Trinity Large Preview (free) none Lançamento: 2026-01-27 Disponível grátis Inception: Mercury 2 medium Lançamento: 2026-02-24
Posição #45 #35
Pontuação média 4.3 5.4
Testes corretos
Consistência 9.6 8.3
Custo por resultado 0.000 0.622
Custo total $0.000 $0.044
Taxa de acerto por tentativa 35.6% 57.8%
Testes instáveis 1 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokens de saída 1,713 3,571
Tokens de raciocínio 0 45,379
Tempo de resposta (médio) 3.17s 2.47s
Tempo de resposta (máx.) 8.91s 14.63s
Tempo de resposta (total) 47.61s 34.56s

Melhores modelos por pontuação

Tempo de resposta (médio)

Pontuação vs custo total

Pontuação média vs Tempo de resposta (médio)

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 10.0 10.0 0.0% 0 3.59s 587 0
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 10.0 10.0 0.0% 0 8.91s 294 0
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 9.9 10.0 100.0% 0 3.26s 186 0
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 4.0 10.0 33.3% 0 877ms 25 0
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 3.5 6.7 16.7% 1 1.09s 63 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 4.0 10.0 33.3% 0 3.30s 291 0
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Arcee AI: Trinity Large Preview (free) 10.0 10.0 100.0% 0 6.67s 267 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

Comparação rápida

Trocar par de comparação