inclusionAI: Ling-2.6-flash vs MoonshotAI: Kimi K2.5

Kimi K2.5 lidera na pontuação média com 5.5 vs 4.9. Ling-2.6-flash tem menor custo de benchmark com $0.002 vs $0.127. Ling-2.6-flash é mais rápido com 10.68s vs 19.15s, com taxas de acerto de 30.3% vs 34.9%.

Modelo recomendadoLing-2.6-flashA pontuação fica perto da melhor aqui (4.9 vs 5.5) e custa cerca de 79.7x menos que Kimi K2.5.

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-07-21

Métrica	Ling-2.6-flash Ling-2.6-flash none Lançamento: 2026-04-21	Kimi K2.5 Kimi K2.5 none Lançamento: 2026-01-27

Métrica	Ling-2.6-flash Ling-2.6-flash none Lançamento: 2026-04-21	Kimi K2.5 Kimi K2.5 none Lançamento: 2026-01-27
Pontuação	4.9	5.5
Posição	#184	#161
Confiabilidade	10.0	10.0
Consistência	9.3	8.6
Testes corretos
Taxa de acerto por tentativa	30.3%	34.9%
Testes instáveis	2	4
Execuções totais	66	66
Custo por resultado	0.024	1.898
Custo total	$0.002	$0.127
Preço de entrada	$0.010 / 1M	$0.571 / 1M
Preço de saída	$0.030 / 1M	$2.850 / 1M
Total de tokens de entrada	114,375	89,322
Tokens de saída	14,903	26,638
Tokens de raciocínio	0	0
Tempo de resposta (médio)	10.68s	19.15s
Tempo de resposta (máx.)	36.03s	102.83s
Tempo de resposta (total)	213.51s	287.30s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#184 Ling-2.6-flash

none

Ling-2.6-flash is no longer available as a free model. It has transitioned to a paid model. Continue using it here: https://openrouter.ai/inclusionai/ling-2.6-flash

Custo: $0.000
Tempo: 0.0s
Tokens: 0 tok

#161 MoonshotAI: Kimi K2.5

none

Custo: $0.015
Tempo: 89.1s
Tokens: 5,421 tok

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Categoria:

Truques anti-IA	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	726	573	0
Kimi K2.5	3.6	8.4	8.3%	1		6.24s	652	373	0

Programação	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	5.3	10.0	33.3%	0		11.21s	813	381	0
Kimi K2.5	5.5	10.0	33.3%	0		24.56s	7,311	4,708	0

Combinado	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	3.0	10.0	0.0%	0		35.69s	94,475	13,094	0
Kimi K2.5	2.8	1.8	33.3%	2		61.00s	65,552	20,729	0

Análise e extração de dados	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	8,004	246	0
Kimi K2.5	7.3	5.8	83.3%	1		42.13s	7,180	187	0

Específico do domínio	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	810	24	0
Kimi K2.5	5.3	10.0	33.3%	0		4.38s	753	29	0

Inteligência geral	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	540	109	0
Kimi K2.5	10.0	10.0	100.0%	0		4.00s	483	76	0

Seguimento de instruções	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	732	81	0
Kimi K2.5	6.5	10.0	50.0%	0		2.67s	677	60	0

Resolução de quebra-cabeças	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	729	151	0
Kimi K2.5	3.0	10.0	0.0%	0		4.04s	667	236	0

Chamada de ferramentas	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	7,324	229	0
Kimi K2.5	10.0	10.0	100.0%	0		13.99s	5,835	220	0

Conhecimentos gerais	Pontuação	Consistência	Taxa de acerto por tentativa	Testes instáveis	Testes corretos	Tempo de resposta (médio)	Tokens de entrada	Tokens de saída	Tokens de raciocínio
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	222	15	0
Kimi K2.5	3.0	10.0	0.0%	0		3.90s	212	20	0

Comparação rápida

Trocar par de comparação

KAT-Coder-Air V2.5mediumvsKimi K2.5none KAT-Coder-Air V2.5lowvsKimi K2.5none KAT-Coder-Air V2.5highvsKimi K2.5none Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsQwen3 Coder Nextmedium CobuddymediumvsLing-2.6-flashnone Kimi K2.5nonevsNemotron 3 SupermediumDisponível grátis Ling-2.6-flashnonevsMistral Small 4medium Ling-2.6-flashnonevsMiniMax M2.5medium North Mini CodemediumDisponível grátisvsKimi K2.5none Mistral Small 4mediumvsKimi K2.5none MiniMax M2.7mediumvsKimi K2.5none