AI BENCHY Compare

inclusionAI: Ling-2.6-1T vs OpenAI: gpt-oss-120b

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-05-29

Métrica	Ling-2.6-1T Ling-2.6-1T none Lançamento: 2026-04-23	gpt-oss-120b gpt-oss-120b none Lançamento: 2025-08-05 Disponível grátis

Métrica	Ling-2.6-1T Ling-2.6-1T none Lançamento: 2026-04-23	gpt-oss-120b gpt-oss-120b none Lançamento: 2025-08-05 Disponível grátis
Pontuação	4.5	5.4
Posição	#153	#124
Confiabilidade	N/D	10.0
Consistência	10.0	9.1
Testes corretos
Taxa de acerto por tentativa	16.7%	38.6%
Testes instáveis	0	2
Execuções totais	60	57
Custo por resultado	0.000	0.168
Custo total	$0.000	$0.011
Preço de entrada	$0.075 / 1M	$0.039 / 1M
Preço de saída	$0.625 / 1M	$0.180 / 1M
Tokens de saída	2,434	51,664
Tokens de raciocínio	0	0
Tempo de resposta (médio)	7.72s	21.61s
Tempo de resposta (máx.)	25.72s	113.71s
Tempo de resposta (total)	139.00s	345.79s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	3.4	10.0	0.0%	0		6.55s	777	0
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	8,676	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	5.5	10.0	0.0%	0		10.57s	381	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	3.0	10.0	0.0%	0		23.53s	183	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	10.0	10.0	100.0%	0		1.37s	285	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	3.0	10.0	0.0%	0		1.04s	27	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	5.0	10.0	0.0%	0		20.34s	140	0
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	615	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	6.4	10.0	50.0%	0		5.36s	81	0
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,940	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	3.1	10.0	0.0%	0		5.36s	131	0
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	3,982	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	3.0	10.0	0.0%	0		25.72s	429	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de saída	Tokens de raciocínio
Ling-2.6-1T	0.0	0.0	0.0%	0		0ms	0	0
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	3,138	0

Comparação rápida

Trocar par de comparação

Ling-2.6-1TnonevsGLM 4.7 Flashmedium MiniMax M2.5mediumDisponível grátisvsgpt-oss-120bnoneDisponível grátis Mistral Small 4mediumvsgpt-oss-120bnoneDisponível grátis gpt-oss-120bnoneDisponível grátisvsElephant Alphamedium MiniMax M2.7mediumvsgpt-oss-120bnoneDisponível grátis Ling-2.6-1TnonevsQwen3.5-9Bmedium Ling-2.6-1TnonevsQwen3 Coder Nextmedium Cobuddymediumvsgpt-oss-120bnoneDisponível grátis gpt-oss-120bnoneDisponível grátisvsOwl Alphamedium Nemotron 3 SupermediumDisponível grátisvsgpt-oss-120bnoneDisponível grátis gpt-oss-120bnoneDisponível grátisvsQwen3 Coder Nextmedium Ling-2.6-1TnonevsMiniMax M2.7medium