Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs inclusionAI: Ring-2.6-1T

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-06-03

Métrica Mercury 2 Mercury 2 medium Lançamento: 2026-02-24 Ring-2.6-1T Ring-2.6-1T none Lançamento: 2026-05-10
Pontuação 6.5 6.4
Posição #89 #93
Confiabilidade 10.0 10.0
Consistência 8.8 9.3
Testes corretos
Taxa de acerto por tentativa 51.7% 50.0%
Testes instáveis 3 2
Execuções totais 60 60
Custo por resultado 0.611 0.000
Custo total $0.055 $0.026
Preço de entrada $0.250 / 1M $0.075 / 1M
Preço de saída $0.750 / 1M $0.625 / 1M
Total de tokens de entrada 32,570 7,599
Tokens de saída 4,022 39,954
Tokens de raciocínio 58,405 0
Tempo de resposta (médio) 2.27s 55.10s
Tempo de resposta (máx.) 14.63s 143.82s
Tempo de resposta (total) 43.20s 881.55s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 810 5,575 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
Ring-2.6-1T 6.5 10.0 50.0% 0 143.82s 834 5,036 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 2,712 1,529 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 873 17,728 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 561 846 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 774 2,004 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 792 3,469 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de entrada Tokens de saída Tokens de raciocínio
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 243 3,767 0

Comparação rápida

Trocar par de comparação