Navegação
AI BENCHY
Your ad here

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

Benchmarks gerados a partir das suítes de teste do AI BENCHY em: 2026-04-16

Métrica Trinity Large Preview Trinity Large Preview none Lançamento: 2026-01-27 Disponível grátis GLM 4.7 Flash GLM 4.7 Flash medium Lançamento: 2026-01-19
Pontuação 5.3 4.6
Posição #76 #91
Consistência 9.6 6.3
Testes corretos
Taxa de acerto por tentativa 29.6% 38.9%
Testes instáveis 1 8
Execuções totais 52 54
Custo por resultado 0.000 1.126
Custo total $0.000 $0.046
Preço de entrada $0.000 / 1M $0.060 / 1M
Preço de saída $0.000 / 1M $0.400 / 1M
Tokens de saída 1,985 39,688
Tokens de raciocínio 0 72,401
Tempo de resposta (médio) 5.07s 32.33s
Tempo de resposta (máx.) 39.47s 174.55s
Tempo de resposta (total) 91.23s 355.65s

Melhores modelos por pontuação

Pontuação vs custo total

Tempo de resposta (médio)

Pontuação vs Tempo de resposta (médio)

Total de tokens de saída

Pontuação vs Total de tokens de saída

Detalhamento por categoria

Truques anti-IA Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 3.0 10.0 0.0% 0 3.02s 593 0
GLM 4.7 Flash 4.7 5.9 41.7% 2 14.95s 1,122 6,110
Programação Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 6.3 10.0 0.0% 0 39.47s 142 0
GLM 4.7 Flash 3.6 2.1 33.3% 1 21.26s 969 6,936
Combinado Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 3.0 10.0 0.0% 0 8.91s 294 0
GLM 4.7 Flash 2.8 2.1 33.3% 1 65.57s 2,585 20,648
Análise e extração de dados Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 10.0 10.0 100.0% 0 3.26s 186 0
GLM 4.7 Flash 6.3 10.0 50.0% 0 1.51s 584 2,755
Específico do domínio Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 5.3 10.0 33.3% 0 877ms 25 0
GLM 4.7 Flash 3.5 4.4 33.3% 2 174.55s 33,000 25,394
Inteligência geral Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 4.4 9.9 0.0% 0 2.86s 124 0
GLM 4.7 Flash 3.6 9.7 0.0% 0 18.14s 18 2,138
Seguimento de instruções Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 4.1 6.7 16.7% 1 1.09s 63 0
GLM 4.7 Flash 6.2 5.8 66.7% 1 2.97s 388 2,181
Resolução de quebra-cabeças Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 5.4 10.0 33.3% 0 3.30s 291 0
GLM 4.7 Flash 2.9 7.2 11.1% 1 12.90s 798 5,225
Chamada de ferramentas Pontuação Consistência Taxa de acerto por tentativa Testes instáveis Testes corretos Tempo de resposta (médio) Tokens de saída Tokens de raciocínio
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

Comparação rápida

Trocar par de comparação