Navegação
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs inclusionAI: Ring-2.6-1T

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica DeepSeek V4 Pro DeepSeek V4 Pro high Lançamento: 2026-04-24 Ring-2.6-1T Ring-2.6-1T none Lançamento: 2026-05-10
Pontuação 7.0 7.2
Posição #79 #70
Confiabilidade 8.9 10.0
Consistência 8.7 9.1
Testes corretos
Taxa de acerto por tentativa 63.3% 62.5%
Testes instáveis 3 2
Execuções totais 60 60
Custo por resultado 1.935 0.000
Custo total $0.213 $0.000
Preço de entrada $0.435 / 1M $0.075 / 1M
Preço de saída $0.870 / 1M $0.625 / 1M
Tokens de saída 12,244 39,954
Tokens de raciocínio 53,958 0
Tempo de resposta (médio) 58.92s 55.10s
Tempo de resposta (máx.) 358.35s 143.82s
Tempo de resposta (total) 1119.51s 881.55s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 8.3 10.0 75.0% 0 16.53s 71 3,617
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 5,575 0
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 5.0 25.0% 1 51.77s 105 2,641
Ring-2.6-1T 10.0 10.0 100.0% 0 143.82s 5,036 0
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 65.02s 465 5,914
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 23.62s 229 1,710
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 1,529 0
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.2 6.9 16.7% 1 205.66s 10,529 28,089
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 17,728 0
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 6.1 3.1 66.7% 1 25.09s 76 1,152
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 846 0
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 41.16s 205 2,416
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 2,004 0
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 7.7 10.0 66.7% 0 34.84s 139 4,019
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 3,469 0
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 10.0 10.0 100.0% 0 21.33s 372 593
Ring-2.6-1T 0.0 0.0 0.0% 0 0ms 0 0
Conhecimentos gerais Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
DeepSeek V4 Pro 3.0 10.0 0.0% 0 39.14s 53 3,807
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 3,767 0

Comparação rápida

Trocar par de comparação