AI BENCHY Compare

inclusionAI: Ring-2.6-1T vs Qwen: Qwen3.5-35B-A3B

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-28

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lançamento: 2026-05-10	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24

Métrica	Ring-2.6-1T Ring-2.6-1T medium Lançamento: 2026-05-10	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lançamento: 2026-02-24
Pontuação	7.2	7.3
Posição	#66	#65
Confiabilidade	10.0	10.0
Consistência	8.7	7.5
Testes corretos
Taxa de acerto por tentativa	66.7%	73.3%
Testes instáveis	3	6
Execuções totais	60	60
Custo por resultado	0.000	4.865
Custo total	$0.033	$0.368
Preço de entrada	$0.075 / 1M	$0.139 / 1M
Preço de saída	$0.625 / 1M	$1.000 / 1M
Tokens de saída	21,752	31,242
Tokens de raciocínio	42,754	330,546
Tempo de resposta (médio)	61.29s	69.66s
Tempo de resposta (máx.)	304.19s	409.98s
Tempo de resposta (total)	1164.50s	1393.17s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985
Qwen3.5-35B-A3B	6.5	10.0	50.0%	0		244.54s	14,456	88,431

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	3,592	26,585

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	10,919	72,053

Comparação rápida

Trocar par de comparação

Claude Opus 4.8nonevsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsQwen3.5-35B-A3Bmedium Claude Opus 4.8nonevsRing-2.6-1Tmedium Ring-2.6-1TmediumvsQwen3.6 Max Previewnone GPT-5.3 ChatnonevsQwen3.5-35B-A3Bmedium Ring-2.6-1TmediumvsGPT-5.3 Chatnone Gemini 3.1 Flash LitelowvsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-35B-A3Bmedium Claude Sonnet 4.6nonevsRing-2.6-1Tmedium Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium