Navegação
AI BENCHY
Advertise here

AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs MoonshotAI: Kimi K2.6

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-22

Métrica Ring-2.6-1T Ring-2.6-1T none Lançamento: 2026-05-10 Kimi K2.6 Kimi K2.6 medium Lançamento: 2026-04-20
Pontuação 7.2 7.4
Posição #62 #54
Confiabilidade 9.8 8.3
Consistência 9.1 8.3
Testes corretos
Taxa de acerto por tentativa 62.5% 70.8%
Testes instáveis 2 4
Execuções totais 60 60
Custo por resultado 0.000 7.630
Custo total $0.000 $0.916
Preço de entrada $0.075 / 1M $0.730 / 1M
Preço de saída $0.625 / 1M $3.490 / 1M
Tokens de saída 39,954 102,488
Tokens de raciocínio 0 229,389
Tempo de resposta (médio) 55.10s 54.11s
Tempo de resposta (máx.) 143.82s 215.85s
Tempo de resposta (total) 881.55s 1028.14s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 5,575 0
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 10.0 10.0 100.0% 0 143.82s 5,036 0
Kimi K2.6 6.5 5.3 75.0% 1 118.23s 9,255 52,215
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 1,529 0
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 17,728 0
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 846 0
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 2,004 0
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 3,469 0
Kimi K2.6 6.0 7.4 55.6% 1 25.59s 14,140 17,868
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 3,767 0
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177

Comparação rápida

Trocar par de comparação