Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)2.27sTempo de resposta (máx.)6.58sTempo de resposta (total)45.50s…
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.80sTempo de resposta (máx.)2.62sTempo de resposta (total)7.19s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.65sTempo de resposta (máx.)3.82sTempo de resposta (total)5.30s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.58sTempo de resposta (máx.)6.58sTempo de resposta (total)6.58s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.39sTempo de resposta (máx.)1.42sTempo de resposta (total)2.78s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.78sTempo de resposta (máx.)2.49sTempo de resposta (total)5.34s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.44sTempo de resposta (máx.)2.44sTempo de resposta (total)2.44s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.51sTempo de resposta (máx.)2.95sTempo de resposta (total)5.02s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.39sTempo de resposta (máx.)4.39sTempo de resposta (total)4.39s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.63sTempo de resposta (máx.)1.63sTempo de resposta (total)1.63s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Tempo de resposta (médio)2.40sTempo de resposta (máx.)6.65sTempo de resposta (total)33.56s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.91sTempo de resposta (máx.)2.74sTempo de resposta (total)3.82s
Programação
: 4.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.54sTempo de resposta (máx.)3.63sTempo de resposta (total)5.09s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.65sTempo de resposta (máx.)6.65sTempo de resposta (total)6.65s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.89sTempo de resposta (máx.)1.89sTempo de resposta (total)1.89s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.44sTempo de resposta (total)2.33s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.26sTempo de resposta (máx.)2.26sTempo de resposta (total)2.26s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.67sTempo de resposta (máx.)1.67sTempo de resposta (total)1.67s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.71sTempo de resposta (máx.)3.29sTempo de resposta (total)5.41s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.33sTempo de resposta (máx.)3.33sTempo de resposta (total)3.33s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.11sTempo de resposta (total)1.11s
Programação
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Resposta incorreta: 1Tempo de resposta (médio)2.75sTempo de resposta (máx.)3.79sTempo de resposta (total)5.50s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.96sTempo de resposta (máx.)5.96sTempo de resposta (total)5.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.76sTempo de resposta (máx.)2.60sTempo de resposta (total)3.51s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.10sTempo de resposta (máx.)3.58sTempo de resposta (total)6.30s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.33sTempo de resposta (máx.)2.33sTempo de resposta (total)2.33s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.26sTempo de resposta (máx.)6.81sTempo de resposta (total)8.51s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.16sTempo de resposta (máx.)1.55sTempo de resposta (total)3.48s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.40sTempo de resposta (máx.)5.40sTempo de resposta (total)5.40s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.30sTempo de resposta (máx.)1.30sTempo de resposta (total)1.30s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Tempo de resposta (médio)2.48sTempo de resposta (máx.)6.70sTempo de resposta (total)49.67s…
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.43sTempo de resposta (máx.)6.70sTempo de resposta (total)9.73s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.95sTempo de resposta (máx.)4.61sTempo de resposta (total)5.89s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.59sTempo de resposta (máx.)6.59sTempo de resposta (total)6.59s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.82sTempo de resposta (máx.)1.97sTempo de resposta (total)3.63s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.33sTempo de resposta (máx.)1.53sTempo de resposta (total)4.00s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.45sTempo de resposta (máx.)3.45sTempo de resposta (total)3.45s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.06sTempo de resposta (máx.)1.09sTempo de resposta (total)2.12s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.78sTempo de resposta (máx.)5.20sTempo de resposta (total)8.34s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.94sTempo de resposta (máx.)3.94sTempo de resposta (total)3.94s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.96sTempo de resposta (máx.)1.96sTempo de resposta (total)1.96s
Truques anti-IA
: 3.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.19sTempo de resposta (máx.)2.73sTempo de resposta (total)4.76s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.87sTempo de resposta (máx.)2.87sTempo de resposta (total)2.87s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)564msTempo de resposta (máx.)564msTempo de resposta (total)564ms
Inteligência geral
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.67sTempo de resposta (máx.)1.67sTempo de resposta (total)1.67s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)857msTempo de resposta (máx.)955msTempo de resposta (total)1.71s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.86sTempo de resposta (máx.)2.70sTempo de resposta (total)3.71s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.28sTempo de resposta (máx.)2.28sTempo de resposta (total)2.28s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.82sTempo de resposta (máx.)1.82sTempo de resposta (total)1.82s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)2.85sTempo de resposta (máx.)11.91sTempo de resposta (total)57.08s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.12sTempo de resposta (máx.)3.18sTempo de resposta (total)8.50s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.56sTempo de resposta (máx.)2.20sTempo de resposta (total)3.13s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)11.91sTempo de resposta (máx.)11.91sTempo de resposta (total)11.91s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.00sTempo de resposta (máx.)3.74sTempo de resposta (total)5.99s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.36sTempo de resposta (máx.)3.51sTempo de resposta (total)7.07s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.54sTempo de resposta (máx.)1.54sTempo de resposta (total)1.54s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.49sTempo de resposta (máx.)1.66sTempo de resposta (total)2.99s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.69sTempo de resposta (máx.)1.89sTempo de resposta (total)5.08s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.54sTempo de resposta (máx.)9.54sTempo de resposta (total)9.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.35sTempo de resposta (máx.)1.35sTempo de resposta (total)1.35s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 2Tempo de resposta (médio)2.86sTempo de resposta (máx.)8.21sTempo de resposta (total)57.24s…
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.84sTempo de resposta (máx.)4.15sTempo de resposta (total)11.35s
Programação
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.58sTempo de resposta (máx.)3.93sTempo de resposta (total)5.16s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.89sTempo de resposta (máx.)4.89sTempo de resposta (total)4.89s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.47sTempo de resposta (máx.)2.48sTempo de resposta (total)4.95s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.97sTempo de resposta (máx.)2.65sTempo de resposta (total)5.92s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.18sTempo de resposta (máx.)2.18sTempo de resposta (total)2.18s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.13sTempo de resposta (máx.)2.53sTempo de resposta (total)4.27s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.21sTempo de resposta (máx.)8.21sTempo de resposta (total)8.21s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.37sTempo de resposta (máx.)2.37sTempo de resposta (total)2.37s
Truques anti-IA
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Erro de API: 1Tempo de resposta (médio)705msTempo de resposta (máx.)975msTempo de resposta (total)2.12s
Programação
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.93sTempo de resposta (máx.)2.93sTempo de resposta (total)2.93s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)4.32sTempo de resposta (máx.)4.32sTempo de resposta (total)4.32s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.37sTempo de resposta (máx.)5.76sTempo de resposta (total)6.73s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)5.50sTempo de resposta (máx.)15.42sTempo de resposta (total)16.50s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)683msTempo de resposta (máx.)691msTempo de resposta (total)1.37s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.54sTempo de resposta (máx.)7.54sTempo de resposta (total)7.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 9Não seguiu as instruções: 1Tempo de resposta (médio)2.95sTempo de resposta (máx.)29.38sTempo de resposta (total)58.96s…
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.38sTempo de resposta (máx.)2.69sTempo de resposta (total)5.51s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.77sTempo de resposta (máx.)4.39sTempo de resposta (total)5.54s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)29.38sTempo de resposta (máx.)29.38sTempo de resposta (total)29.38s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.43sTempo de resposta (máx.)1.57sTempo de resposta (total)2.86s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)868msTempo de resposta (máx.)1.02sTempo de resposta (total)2.60s
Inteligência geral
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.33sTempo de resposta (máx.)1.33sTempo de resposta (total)1.33s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)929msTempo de resposta (máx.)1.05sTempo de resposta (total)1.86s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.71sTempo de resposta (máx.)2.65sTempo de resposta (total)5.13s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.21sTempo de resposta (máx.)1.21sTempo de resposta (total)1.21s
Truques anti-IA
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.07sTempo de resposta (máx.)4.40sTempo de resposta (total)8.30s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)14.34sTempo de resposta (máx.)14.34sTempo de resposta (total)14.34s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.91sTempo de resposta (máx.)8.91sTempo de resposta (total)8.91s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.26sTempo de resposta (máx.)4.66sTempo de resposta (total)6.52s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)877msTempo de resposta (máx.)894msTempo de resposta (total)2.63s
Inteligência geral
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)873msTempo de resposta (máx.)873msTempo de resposta (total)873ms
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.67sTempo de resposta (máx.)6.67sTempo de resposta (total)6.67s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)777msTempo de resposta (máx.)777msTempo de resposta (total)777ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.98sTempo de resposta (máx.)6.44sTempo de resposta (total)59.59s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.52sTempo de resposta (máx.)5.40sTempo de resposta (total)10.08s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.54sTempo de resposta (máx.)5.59sTempo de resposta (total)11.08s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.44sTempo de resposta (máx.)6.44sTempo de resposta (total)6.44s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.81sTempo de resposta (máx.)2.32sTempo de resposta (total)3.63s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.39sTempo de resposta (máx.)4.44sTempo de resposta (total)10.16s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.27sTempo de resposta (máx.)2.27sTempo de resposta (total)2.27s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.86sTempo de resposta (máx.)2.10sTempo de resposta (total)3.73s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.35sTempo de resposta (máx.)3.25sTempo de resposta (total)7.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.27sTempo de resposta (máx.)3.27sTempo de resposta (total)3.27s
Conhecimentos gerais
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.88sTempo de resposta (máx.)1.88sTempo de resposta (total)1.88s
Truques anti-IA
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)5.51sTempo de resposta (máx.)6.59sTempo de resposta (total)11.02s
Programação
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.35sTempo de resposta (máx.)5.57sTempo de resposta (total)6.70s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)3.22sTempo de resposta (máx.)3.22sTempo de resposta (total)3.22s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.82sTempo de resposta (máx.)4.82sTempo de resposta (total)4.82s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)744msTempo de resposta (máx.)744msTempo de resposta (total)744ms
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.59sTempo de resposta (máx.)1.59sTempo de resposta (total)1.59s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)888msTempo de resposta (máx.)888msTempo de resposta (total)888ms
Chamada de ferramentas
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.05sTempo de resposta (máx.)7.05sTempo de resposta (total)7.05s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)692msTempo de resposta (máx.)692msTempo de resposta (total)692ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.02sTempo de resposta (máx.)18.27sTempo de resposta (total)57.44s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.12sTempo de resposta (máx.)3.75sTempo de resposta (total)8.50s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.84sTempo de resposta (máx.)2.84sTempo de resposta (total)2.84s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.27sTempo de resposta (máx.)18.27sTempo de resposta (total)18.27s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.15sTempo de resposta (máx.)2.33sTempo de resposta (total)4.29s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.19sTempo de resposta (máx.)1.40sTempo de resposta (total)3.58s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.47sTempo de resposta (máx.)3.47sTempo de resposta (total)3.47s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.46sTempo de resposta (máx.)1.68sTempo de resposta (total)2.91s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.46sTempo de resposta (máx.)3.72sTempo de resposta (total)7.38s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.74sTempo de resposta (máx.)4.74sTempo de resposta (total)4.74s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.46sTempo de resposta (máx.)1.46sTempo de resposta (total)1.46s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Não seguiu as instruções: 2Tempo de resposta (médio)3.04sTempo de resposta (máx.)6.51sTempo de resposta (total)60.88s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.13sTempo de resposta (máx.)5.90sTempo de resposta (total)12.50s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.77sTempo de resposta (máx.)5.30sTempo de resposta (total)7.54s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.51sTempo de resposta (máx.)6.51sTempo de resposta (total)6.51s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.81sTempo de resposta (máx.)5.69sTempo de resposta (total)7.62s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.09sTempo de resposta (máx.)2.39sTempo de resposta (total)6.26s
Inteligência geral
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.22sTempo de resposta (máx.)2.22sTempo de resposta (total)2.22s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.97sTempo de resposta (máx.)2.43sTempo de resposta (total)3.93s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.86sTempo de resposta (máx.)4.86sTempo de resposta (total)4.86s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.23sTempo de resposta (máx.)2.23sTempo de resposta (total)2.23s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)3.18sTempo de resposta (máx.)10.87sTempo de resposta (total)63.55s…
Truques anti-IA
: 9.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.39sTempo de resposta (máx.)3.58sTempo de resposta (total)9.57s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.59sTempo de resposta (máx.)3.93sTempo de resposta (total)7.19s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.87sTempo de resposta (máx.)10.87sTempo de resposta (total)10.87s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.60sTempo de resposta (máx.)2.69sTempo de resposta (total)5.19s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.16sTempo de resposta (máx.)3.89sTempo de resposta (total)9.49s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.60sTempo de resposta (máx.)2.60sTempo de resposta (total)2.60s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.59sTempo de resposta (máx.)3.04sTempo de resposta (total)5.17s
Resolução de quebra-cabeças
: 7.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.95sTempo de resposta (máx.)2.48sTempo de resposta (total)5.84s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.55sTempo de resposta (máx.)4.55sTempo de resposta (total)4.55s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.08sTempo de resposta (máx.)3.08sTempo de resposta (total)3.08s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 9Tempo de resposta (médio)3.31sTempo de resposta (máx.)20.51sTempo de resposta (total)66.17s…
Truques anti-IA
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.63sTempo de resposta (máx.)5.57sTempo de resposta (total)10.53s
Programação
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.06sTempo de resposta (máx.)3.45sTempo de resposta (total)6.12s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)20.51sTempo de resposta (máx.)20.51sTempo de resposta (total)20.51s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.87sTempo de resposta (máx.)3.54sTempo de resposta (total)5.74s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.22sTempo de resposta (máx.)1.25sTempo de resposta (total)3.67s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.62sTempo de resposta (máx.)1.62sTempo de resposta (total)1.62s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.40sTempo de resposta (máx.)1.46sTempo de resposta (total)2.79s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.65sTempo de resposta (máx.)3.59sTempo de resposta (total)7.94s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.27sTempo de resposta (máx.)5.27sTempo de resposta (total)5.27s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.97sTempo de resposta (máx.)1.97sTempo de resposta (total)1.97s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 2Tempo de resposta (médio)3.38sTempo de resposta (máx.)46.00sTempo de resposta (total)67.55s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.59sTempo de resposta (máx.)3.60sTempo de resposta (total)6.38s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.14sTempo de resposta (máx.)3.44sTempo de resposta (total)4.29s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)46.00sTempo de resposta (máx.)46.00sTempo de resposta (total)46.00s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.01sTempo de resposta (máx.)1.06sTempo de resposta (total)2.02s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)465msTempo de resposta (máx.)492msTempo de resposta (total)1.39s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.12sTempo de resposta (máx.)1.12sTempo de resposta (total)1.12s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)513msTempo de resposta (máx.)570msTempo de resposta (total)1.03s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.04sTempo de resposta (máx.)2.04sTempo de resposta (total)2.04s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)295msTempo de resposta (máx.)295msTempo de resposta (total)295ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)3.50sTempo de resposta (máx.)47.43sTempo de resposta (total)70.00s…
Truques anti-IA
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.43sTempo de resposta (máx.)4.39sTempo de resposta (total)5.71s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.72sTempo de resposta (máx.)2.67sTempo de resposta (total)3.43s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.43sTempo de resposta (máx.)47.43sTempo de resposta (total)47.43s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.16sTempo de resposta (máx.)1.42sTempo de resposta (total)2.33s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)485msTempo de resposta (máx.)549msTempo de resposta (total)1.45s
Inteligência geral
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.19sTempo de resposta (máx.)1.19sTempo de resposta (total)1.19s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)809msTempo de resposta (máx.)983msTempo de resposta (total)1.62s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.30sTempo de resposta (máx.)2.30sTempo de resposta (total)2.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)493msTempo de resposta (máx.)493msTempo de resposta (total)493ms
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 2Tempo de resposta (médio)3.40sTempo de resposta (máx.)6.36sTempo de resposta (total)13.58s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.59sTempo de resposta (máx.)4.34sTempo de resposta (total)7.17s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.73sTempo de resposta (máx.)17.73sTempo de resposta (total)17.73s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.77sTempo de resposta (máx.)1.93sTempo de resposta (total)3.53s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.66sTempo de resposta (máx.)2.16sTempo de resposta (total)4.99s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.48sTempo de resposta (máx.)3.48sTempo de resposta (total)3.48s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.37sTempo de resposta (máx.)1.40sTempo de resposta (total)2.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)2.74sTempo de resposta (máx.)3.46sTempo de resposta (total)8.22s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.35sTempo de resposta (máx.)5.35sTempo de resposta (total)5.35s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)3.41sTempo de resposta (máx.)3.41sTempo de resposta (total)3.41s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Tempo de resposta (médio)3.74sTempo de resposta (máx.)27.18sTempo de resposta (total)74.71s…
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.32sTempo de resposta (máx.)3.89sTempo de resposta (total)5.30s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)993msTempo de resposta (máx.)1.29sTempo de resposta (total)1.99s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.22sTempo de resposta (máx.)6.22sTempo de resposta (total)6.22s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.57sTempo de resposta (máx.)1.83sTempo de resposta (total)3.14s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)905msTempo de resposta (máx.)1.10sTempo de resposta (total)2.71s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)803msTempo de resposta (máx.)803msTempo de resposta (total)803ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.81sTempo de resposta (máx.)13.73sTempo de resposta (total)17.61s
Resolução de quebra-cabeças
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)10.89sTempo de resposta (máx.)27.18sTempo de resposta (total)32.68s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.67sTempo de resposta (máx.)3.67sTempo de resposta (total)3.67s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)588msTempo de resposta (máx.)588msTempo de resposta (total)588ms
Truques anti-IA
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.10sTempo de resposta (máx.)6.15sTempo de resposta (total)8.41s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.29sTempo de resposta (máx.)22.52sTempo de resposta (total)24.58s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.46sTempo de resposta (máx.)2.03sTempo de resposta (total)2.93s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)7.45sTempo de resposta (máx.)12.46sTempo de resposta (total)22.35s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.51sTempo de resposta (máx.)3.51sTempo de resposta (total)3.51s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.86sTempo de resposta (máx.)2.83sTempo de resposta (total)3.73s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)414msTempo de resposta (máx.)414msTempo de resposta (total)414ms
Truques anti-IA
: 3.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.83sTempo de resposta (máx.)7.62sTempo de resposta (total)11.33s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.75sTempo de resposta (máx.)10.18sTempo de resposta (total)11.51s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)9.95sTempo de resposta (máx.)9.95sTempo de resposta (total)9.95s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.06sTempo de resposta (máx.)2.39sTempo de resposta (total)4.11s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.03sTempo de resposta (máx.)4.83sTempo de resposta (total)9.08s
Inteligência geral
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.07sTempo de resposta (total)1.07s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.92sTempo de resposta (máx.)1.94sTempo de resposta (total)3.83s
Chamada de ferramentas
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.74sTempo de resposta (máx.)6.74sTempo de resposta (total)6.74s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.03sTempo de resposta (máx.)4.03sTempo de resposta (total)4.03s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)3.94sTempo de resposta (máx.)14.93sTempo de resposta (total)78.74s…
Truques anti-IA
: 9.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.33sTempo de resposta (máx.)3.89sTempo de resposta (total)9.30s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.98sTempo de resposta (máx.)4.34sTempo de resposta (total)7.95s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.93sTempo de resposta (máx.)14.93sTempo de resposta (total)14.93s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.29sTempo de resposta (máx.)2.31sTempo de resposta (total)4.59s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)4.21sTempo de resposta (máx.)5.86sTempo de resposta (total)12.62s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.16sTempo de resposta (máx.)3.16sTempo de resposta (total)3.16s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.91sTempo de resposta (máx.)1.93sTempo de resposta (total)3.82s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.30sTempo de resposta (máx.)9.55sTempo de resposta (total)15.89s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.80sTempo de resposta (máx.)3.80sTempo de resposta (total)3.80s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.68sTempo de resposta (máx.)2.68sTempo de resposta (total)2.68s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Tempo de resposta (médio)3.95sTempo de resposta (máx.)11.07sTempo de resposta (total)51.38s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.37sTempo de resposta (máx.)3.39sTempo de resposta (total)4.75s
Programação
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)5.18sTempo de resposta (máx.)8.84sTempo de resposta (total)10.37s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.98sTempo de resposta (máx.)4.98sTempo de resposta (total)4.98s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.78sTempo de resposta (máx.)5.78sTempo de resposta (total)5.78s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.24sTempo de resposta (máx.)2.24sTempo de resposta (total)2.24s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.27sTempo de resposta (máx.)3.27sTempo de resposta (total)3.27s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.48sTempo de resposta (máx.)1.48sTempo de resposta (total)1.48s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.91sTempo de resposta (máx.)2.08sTempo de resposta (total)3.82s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.07sTempo de resposta (máx.)11.07sTempo de resposta (total)11.07s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.62sTempo de resposta (máx.)3.62sTempo de resposta (total)3.62s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.85sTempo de resposta (máx.)4.45sTempo de resposta (total)7.40s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)14.84sTempo de resposta (máx.)26.13sTempo de resposta (total)29.68s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.25sTempo de resposta (máx.)3.02sTempo de resposta (total)4.51s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.22sTempo de resposta (máx.)4.68sTempo de resposta (total)9.67s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.09sTempo de resposta (máx.)2.09sTempo de resposta (total)2.09s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.84sTempo de resposta (máx.)4.45sTempo de resposta (total)5.68s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.25sTempo de resposta (máx.)1.25sTempo de resposta (total)1.25s
Truques anti-IA
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.11sTempo de resposta (máx.)3.94sTempo de resposta (total)8.46s
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)6.33sTempo de resposta (máx.)9.79sTempo de resposta (total)12.65s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)32.57sTempo de resposta (máx.)32.57sTempo de resposta (total)32.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.08sTempo de resposta (máx.)1.62sTempo de resposta (total)2.15s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.99sTempo de resposta (máx.)3.99sTempo de resposta (total)5.98s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)790msTempo de resposta (máx.)790msTempo de resposta (total)790ms
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.98sTempo de resposta (máx.)2.28sTempo de resposta (total)3.97s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.45sTempo de resposta (máx.)2.09sTempo de resposta (total)4.36s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.68sTempo de resposta (máx.)10.68sTempo de resposta (total)10.68s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.34sTempo de resposta (máx.)2.34sTempo de resposta (total)2.34s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Não seguiu as instruções: 1Tempo de resposta (médio)4.29sTempo de resposta (máx.)12.05sTempo de resposta (total)85.72s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.09sTempo de resposta (máx.)2.56sTempo de resposta (total)8.35s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)9.91sTempo de resposta (máx.)11.59sTempo de resposta (total)19.82s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.05sTempo de resposta (máx.)12.05sTempo de resposta (total)12.05s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.07sTempo de resposta (máx.)5.60sTempo de resposta (total)8.14s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.24sTempo de resposta (máx.)6.43sTempo de resposta (total)15.73s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.52sTempo de resposta (máx.)2.52sTempo de resposta (total)2.52s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.70sTempo de resposta (máx.)3.07sTempo de resposta (total)5.40s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.38sTempo de resposta (máx.)2.55sTempo de resposta (total)7.15s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.81sTempo de resposta (máx.)3.81sTempo de resposta (total)3.81s
Conhecimentos gerais
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.75sTempo de resposta (máx.)2.75sTempo de resposta (total)2.75s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo esgotado: 1Tempo de resposta (médio)4.48sTempo de resposta (máx.)23.18sTempo de resposta (total)85.21s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.85sTempo de resposta (máx.)2.71sTempo de resposta (total)7.38s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.79sTempo de resposta (máx.)23.18sTempo de resposta (total)29.59s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.45sTempo de resposta (máx.)21.45sTempo de resposta (total)21.45s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.37sTempo de resposta (máx.)3.30sTempo de resposta (total)4.74s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.40sTempo de resposta (total)2.35s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.87sTempo de resposta (máx.)2.87sTempo de resposta (total)2.87s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.57sTempo de resposta (máx.)1.66sTempo de resposta (total)3.14s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.43sTempo de resposta (máx.)2.89sTempo de resposta (total)7.28s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.17sTempo de resposta (máx.)4.17sTempo de resposta (total)4.17s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.25sTempo de resposta (máx.)2.25sTempo de resposta (total)2.25s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)4.57sTempo de resposta (máx.)33.34sTempo de resposta (total)91.37s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.88sTempo de resposta (máx.)4.81sTempo de resposta (total)7.53s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)13.32sTempo de resposta (máx.)13.32sTempo de resposta (total)13.32s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.82sTempo de resposta (máx.)3.86sTempo de resposta (total)5.65s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)4.43sTempo de resposta (máx.)10.83sTempo de resposta (total)13.28s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.41sTempo de resposta (máx.)1.41sTempo de resposta (total)1.41s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.33sTempo de resposta (total)2.35s
Resolução de quebra-cabeças
: 6.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.97sTempo de resposta (máx.)3.43sTempo de resposta (total)5.91s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.42sTempo de resposta (máx.)4.42sTempo de resposta (total)4.42s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)33.34sTempo de resposta (máx.)33.34sTempo de resposta (total)33.34s
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)3.81sTempo de resposta (máx.)6.85sTempo de resposta (total)15.23s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.17sTempo de resposta (máx.)15.17sTempo de resposta (total)15.17s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.49sTempo de resposta (máx.)14.02sTempo de resposta (total)16.98s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.33sTempo de resposta (máx.)2.94sTempo de resposta (total)6.99s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.71sTempo de resposta (máx.)2.71sTempo de resposta (total)2.71s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.82sTempo de resposta (máx.)2.92sTempo de resposta (total)5.65s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.02sTempo de resposta (máx.)6.02sTempo de resposta (total)6.02s