Resumo
Ling-2.6-flash marca 5.0 no AI BENCHY e fica em #138. Tem fiabilidade 10.0, taxa de acerto de 31.8%, custo total de $0.001 e tempo médio de resposta de 9.34s.
O que torna Ling-2.6-flash único: Destaca-se mais em Truques anti-IA, onde fica em #2, enquanto Resolução de quebra-cabeças é a área mais fraca em #13. O custo total do benchmark é invulgarmente baixo para este nível de pontuação.
5.0
Consistência
9.2
10.0
Total de tokens de saída
2,878
Total de tokens de entrada
40,718
Preço de entrada
$0.010 / 1M
Preço de saída
$0.030 / 1M
Testes instáveis
2
Testes instáveis tiveram resultados mistos entre execuções (pelo menos um acerto e uma falha).
Histórico de execuções
| Testado em | Pontuação | Confiabilidade | Testes corretos | Custo total | Comparar |
|---|---|---|---|---|---|
| 2026-06-04 14:30 Novo teste adicionado | 5.0 | 10.0 | $0.001 ↑ | Execução atual | |
| 2026-05-22 00:42 Suite alterada | 5.3 | 10.0 | $0.001 | Comparar | |
| 2026-05-08 15:30 Suite alterada | 5.3 | 10.0 | $0.001 | Comparar | |
| 2026-04-22 12:55 Primeira execução registrada | 5.4 | N/D | $0.000 | Comparar |
Esta execução usou uma suite de benchmark diferente. Considere as mudanças na suite ao analisar a evolução histórica.
Histórico de preços
Dados históricos de preços deste modelo da OpenRouter.
| Data | Preço de entrada | Preço de saída |
|---|---|---|
| 2026-06-04 15:40 | $0.010 / 1M | $0.030 / 1M |
Gráficos
Escolha o primeiro modelo e depois clique em um segundo modelo para abrir uma página lado a lado.
Pontuação vs Custo total
Tempo de resposta (médio)
Pontuação vs Tempo de resposta (médio)
Total de tokens de saída
Pontuação vs Total de tokens de saída
Comparação rápida
Detalhamento por categoria
| Categoria | Pontuação | Consistência | Testes corretos |
|---|---|---|---|
| Truques anti-IA | 6.8 | 8.1 | |
| Programação | 5.3 | 10.0 | |
| Combinado | 3.0 | 10.0 | |
| Análise e extração de dados | 6.5 | 10.0 | |
| Específico do domínio | 3.0 | 10.0 | |
| Inteligência geral | 4.0 | 10.0 | |
| Seguimento de instruções | 9.8 | 10.0 | |
| Resolução de quebra-cabeças | 2.9 | 7.2 | |
| Chamada de ferramentas | 3.0 | 10.0 | |
| Conhecimentos gerais | 3.0 | 10.0 |