Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Tempo de resposta (médio)2.40sTempo de resposta (máx.)6.65sTempo de resposta (total)33.56s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.91sTempo de resposta (máx.)2.74sTempo de resposta (total)3.82s
Programação
: 4.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.54sTempo de resposta (máx.)3.63sTempo de resposta (total)5.09s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.65sTempo de resposta (máx.)6.65sTempo de resposta (total)6.65s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.89sTempo de resposta (máx.)1.89sTempo de resposta (total)1.89s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.44sTempo de resposta (total)2.33s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.26sTempo de resposta (máx.)2.26sTempo de resposta (total)2.26s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.67sTempo de resposta (máx.)1.67sTempo de resposta (total)1.67s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.71sTempo de resposta (máx.)3.29sTempo de resposta (total)5.41s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.33sTempo de resposta (máx.)3.33sTempo de resposta (total)3.33s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.11sTempo de resposta (total)1.11s
Truques anti-IA
: 9.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)43.33sTempo de resposta (máx.)71.76sTempo de resposta (total)173.31s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)143.82sTempo de resposta (máx.)143.82sTempo de resposta (total)143.82s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)73.40sTempo de resposta (máx.)90.09sTempo de resposta (total)220.20s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.63sTempo de resposta (máx.)15.63sTempo de resposta (total)15.63s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)27.36sTempo de resposta (máx.)40.24sTempo de resposta (total)54.72s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)31.47sTempo de resposta (máx.)46.84sTempo de resposta (total)94.41s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)133.60sTempo de resposta (máx.)133.60sTempo de resposta (total)133.60s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Tempo de resposta (médio)889msTempo de resposta (máx.)4.39sTempo de resposta (total)17.79s…
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)582msTempo de resposta (máx.)844msTempo de resposta (total)2.33s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)810msTempo de resposta (máx.)1.16sTempo de resposta (total)1.62s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.39sTempo de resposta (máx.)4.39sTempo de resposta (total)4.39s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)652msTempo de resposta (máx.)660msTempo de resposta (total)1.30s
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)495msTempo de resposta (máx.)642msTempo de resposta (total)1.49s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)615msTempo de resposta (máx.)615msTempo de resposta (total)615ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)590msTempo de resposta (máx.)622msTempo de resposta (total)1.18s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)604msTempo de resposta (máx.)700msTempo de resposta (total)1.81s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.91sTempo de resposta (máx.)1.91sTempo de resposta (total)1.91s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.15sTempo de resposta (máx.)1.15sTempo de resposta (total)1.15s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Tempo de resposta (médio)3.95sTempo de resposta (máx.)11.07sTempo de resposta (total)51.38s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.37sTempo de resposta (máx.)3.39sTempo de resposta (total)4.75s
Programação
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)5.18sTempo de resposta (máx.)8.84sTempo de resposta (total)10.37s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.98sTempo de resposta (máx.)4.98sTempo de resposta (total)4.98s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.78sTempo de resposta (máx.)5.78sTempo de resposta (total)5.78s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.24sTempo de resposta (máx.)2.24sTempo de resposta (total)2.24s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.27sTempo de resposta (máx.)3.27sTempo de resposta (total)3.27s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.48sTempo de resposta (máx.)1.48sTempo de resposta (total)1.48s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.91sTempo de resposta (máx.)2.08sTempo de resposta (total)3.82s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.07sTempo de resposta (máx.)11.07sTempo de resposta (total)11.07s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.62sTempo de resposta (máx.)3.62sTempo de resposta (total)3.62s
Truques anti-IA
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)4.75sTempo de resposta (máx.)7.62sTempo de resposta (total)19.00s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)30.53sTempo de resposta (máx.)30.53sTempo de resposta (total)30.53s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.16sTempo de resposta (máx.)26.55sTempo de resposta (total)46.33s
Inteligência geral
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.44sTempo de resposta (máx.)6.44sTempo de resposta (total)6.44s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.18sTempo de resposta (máx.)4.46sTempo de resposta (total)8.36s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.33sTempo de resposta (máx.)17.33sTempo de resposta (total)17.33s
Truques anti-IA
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Resposta incorreta: 1Tempo de resposta (médio)3.46sTempo de resposta (máx.)4.38sTempo de resposta (total)13.86s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)27.11sTempo de resposta (máx.)27.11sTempo de resposta (total)27.11s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.54sTempo de resposta (máx.)7.51sTempo de resposta (total)11.08s
Inteligência geral
: 5.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.40sTempo de resposta (máx.)6.40sTempo de resposta (total)6.40s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.52sTempo de resposta (máx.)3.80sTempo de resposta (total)7.04s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.28sTempo de resposta (máx.)2.09sTempo de resposta (total)5.13s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)3.83sTempo de resposta (máx.)7.07sTempo de resposta (total)7.66s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)30.53sTempo de resposta (máx.)30.53sTempo de resposta (total)30.53s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.70sTempo de resposta (máx.)2.21sTempo de resposta (total)3.41s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.49sTempo de resposta (máx.)4.23sTempo de resposta (total)7.48s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)690msTempo de resposta (máx.)878msTempo de resposta (total)1.38s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)57.10sTempo de resposta (máx.)57.10sTempo de resposta (total)57.10s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)778msTempo de resposta (máx.)778msTempo de resposta (total)778ms
Programação
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Resposta incorreta: 1Tempo de resposta (médio)2.75sTempo de resposta (máx.)3.79sTempo de resposta (total)5.50s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.96sTempo de resposta (máx.)5.96sTempo de resposta (total)5.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.76sTempo de resposta (máx.)2.60sTempo de resposta (total)3.51s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.10sTempo de resposta (máx.)3.58sTempo de resposta (total)6.30s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.33sTempo de resposta (máx.)2.33sTempo de resposta (total)2.33s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.26sTempo de resposta (máx.)6.81sTempo de resposta (total)8.51s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.16sTempo de resposta (máx.)1.55sTempo de resposta (total)3.48s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.40sTempo de resposta (máx.)5.40sTempo de resposta (total)5.40s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.30sTempo de resposta (máx.)1.30sTempo de resposta (total)1.30s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)25.50sTempo de resposta (máx.)37.73sTempo de resposta (total)51.00s
Programação
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)47.80sTempo de resposta (máx.)54.86sTempo de resposta (total)95.59s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.96sTempo de resposta (máx.)65.96sTempo de resposta (total)65.96s
Análise e extração de dados
: 3.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)21.42sTempo de resposta (máx.)21.42sTempo de resposta (total)21.42s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)17.51sTempo de resposta (máx.)17.51sTempo de resposta (total)17.51s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.64sTempo de resposta (máx.)15.64sTempo de resposta (total)15.64s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)33.30sTempo de resposta (máx.)33.30sTempo de resposta (total)33.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)20.13sTempo de resposta (máx.)20.13sTempo de resposta (total)20.13s
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)16.53sTempo de resposta (máx.)39.91sTempo de resposta (total)66.11s
Programação
: 2.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo esgotado: 1Tempo de resposta (médio)51.77sTempo de resposta (máx.)51.77sTempo de resposta (total)51.77s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.02sTempo de resposta (máx.)65.02sTempo de resposta (total)65.02s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)23.62sTempo de resposta (máx.)36.44sTempo de resposta (total)47.24s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)25.09sTempo de resposta (máx.)25.09sTempo de resposta (total)25.09s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)41.16sTempo de resposta (máx.)43.56sTempo de resposta (total)82.32s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.33sTempo de resposta (máx.)21.33sTempo de resposta (total)21.33s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)39.14sTempo de resposta (máx.)39.14sTempo de resposta (total)39.14s
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)7.85sTempo de resposta (máx.)22.30sTempo de resposta (total)31.40s
Programação
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 2Tempo de resposta (médio)62.38sTempo de resposta (máx.)62.38sTempo de resposta (total)62.38s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)87.80sTempo de resposta (máx.)87.80sTempo de resposta (total)87.80s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.16sTempo de resposta (máx.)20.65sTempo de resposta (total)36.33s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.91sTempo de resposta (máx.)6.91sTempo de resposta (total)6.91s
Seguimento de instruções
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.97sTempo de resposta (máx.)11.23sTempo de resposta (total)13.95s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)39.75sTempo de resposta (máx.)39.75sTempo de resposta (total)39.75s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)55.32sTempo de resposta (máx.)55.32sTempo de resposta (total)55.32s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 9Não seguiu as instruções: 3Tempo de resposta (médio)22.41sTempo de resposta (máx.)68.16sTempo de resposta (total)291.35s…
Programação
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)47.24sTempo de resposta (máx.)68.16sTempo de resposta (total)94.49s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)31.18sTempo de resposta (máx.)31.18sTempo de resposta (total)31.18s
Análise e extração de dados
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.98sTempo de resposta (máx.)1.98sTempo de resposta (total)1.98s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)50.92sTempo de resposta (máx.)50.92sTempo de resposta (total)50.92s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)7.90sTempo de resposta (máx.)7.90sTempo de resposta (total)7.90s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.63sTempo de resposta (máx.)7.63sTempo de resposta (total)7.63s
Chamada de ferramentas
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.91sTempo de resposta (máx.)6.91sTempo de resposta (total)6.91s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)26.51sTempo de resposta (máx.)26.51sTempo de resposta (total)26.51s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Tempo de resposta (médio)3.74sTempo de resposta (máx.)27.18sTempo de resposta (total)74.71s…
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.32sTempo de resposta (máx.)3.89sTempo de resposta (total)5.30s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)993msTempo de resposta (máx.)1.29sTempo de resposta (total)1.99s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.22sTempo de resposta (máx.)6.22sTempo de resposta (total)6.22s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.57sTempo de resposta (máx.)1.83sTempo de resposta (total)3.14s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)905msTempo de resposta (máx.)1.10sTempo de resposta (total)2.71s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)803msTempo de resposta (máx.)803msTempo de resposta (total)803ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.81sTempo de resposta (máx.)13.73sTempo de resposta (total)17.61s
Resolução de quebra-cabeças
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)10.89sTempo de resposta (máx.)27.18sTempo de resposta (total)32.68s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.67sTempo de resposta (máx.)3.67sTempo de resposta (total)3.67s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)588msTempo de resposta (máx.)588msTempo de resposta (total)588ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Não seguiu as instruções: 2Tempo de resposta (médio)3.04sTempo de resposta (máx.)6.51sTempo de resposta (total)60.88s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.13sTempo de resposta (máx.)5.90sTempo de resposta (total)12.50s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.77sTempo de resposta (máx.)5.30sTempo de resposta (total)7.54s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.51sTempo de resposta (máx.)6.51sTempo de resposta (total)6.51s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.81sTempo de resposta (máx.)5.69sTempo de resposta (total)7.62s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.09sTempo de resposta (máx.)2.39sTempo de resposta (total)6.26s
Inteligência geral
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.22sTempo de resposta (máx.)2.22sTempo de resposta (total)2.22s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.97sTempo de resposta (máx.)2.43sTempo de resposta (total)3.93s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.86sTempo de resposta (máx.)4.86sTempo de resposta (total)4.86s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.23sTempo de resposta (máx.)2.23sTempo de resposta (total)2.23s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Tempo de resposta (médio)2.48sTempo de resposta (máx.)6.70sTempo de resposta (total)49.67s…
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.43sTempo de resposta (máx.)6.70sTempo de resposta (total)9.73s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.95sTempo de resposta (máx.)4.61sTempo de resposta (total)5.89s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.59sTempo de resposta (máx.)6.59sTempo de resposta (total)6.59s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.82sTempo de resposta (máx.)1.97sTempo de resposta (total)3.63s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.33sTempo de resposta (máx.)1.53sTempo de resposta (total)4.00s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.45sTempo de resposta (máx.)3.45sTempo de resposta (total)3.45s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.06sTempo de resposta (máx.)1.09sTempo de resposta (total)2.12s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.78sTempo de resposta (máx.)5.20sTempo de resposta (total)8.34s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.94sTempo de resposta (máx.)3.94sTempo de resposta (total)3.94s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.96sTempo de resposta (máx.)1.96sTempo de resposta (total)1.96s
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.97sTempo de resposta (máx.)7.48sTempo de resposta (total)15.89s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)19.08sTempo de resposta (máx.)30.81sTempo de resposta (total)38.16s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.01sTempo de resposta (máx.)10.01sTempo de resposta (total)10.01s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.64sTempo de resposta (máx.)29.16sTempo de resposta (total)43.28s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)8.58sTempo de resposta (máx.)9.48sTempo de resposta (total)25.74s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)58.63sTempo de resposta (máx.)58.63sTempo de resposta (total)58.63s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.15sTempo de resposta (máx.)15.94sTempo de resposta (total)20.30s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.26sTempo de resposta (máx.)8.26sTempo de resposta (total)8.26s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.38sTempo de resposta (máx.)2.38sTempo de resposta (total)2.38s
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.30sTempo de resposta (máx.)9.80sTempo de resposta (total)25.20s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.41sTempo de resposta (máx.)21.41sTempo de resposta (total)21.41s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.47sTempo de resposta (máx.)12.47sTempo de resposta (total)12.47s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.36sTempo de resposta (máx.)11.05sTempo de resposta (total)14.73s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)36.09sTempo de resposta (máx.)36.09sTempo de resposta (total)36.09s
Truques anti-IA
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.11sTempo de resposta (máx.)3.94sTempo de resposta (total)8.46s
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)6.33sTempo de resposta (máx.)9.79sTempo de resposta (total)12.65s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)32.57sTempo de resposta (máx.)32.57sTempo de resposta (total)32.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.08sTempo de resposta (máx.)1.62sTempo de resposta (total)2.15s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.99sTempo de resposta (máx.)3.99sTempo de resposta (total)5.98s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)790msTempo de resposta (máx.)790msTempo de resposta (total)790ms
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.98sTempo de resposta (máx.)2.28sTempo de resposta (total)3.97s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.45sTempo de resposta (máx.)2.09sTempo de resposta (total)4.36s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.68sTempo de resposta (máx.)10.68sTempo de resposta (total)10.68s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.34sTempo de resposta (máx.)2.34sTempo de resposta (total)2.34s
Programação
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)8.27sTempo de resposta (máx.)14.69sTempo de resposta (total)16.54s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)25.49sTempo de resposta (máx.)25.49sTempo de resposta (total)25.49s
Análise e extração de dados
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)30.54sTempo de resposta (máx.)58.65sTempo de resposta (total)61.08s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.17sTempo de resposta (máx.)6.59sTempo de resposta (total)9.52s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.75sTempo de resposta (máx.)3.75sTempo de resposta (total)3.75s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.23sTempo de resposta (máx.)13.43sTempo de resposta (total)16.45s
Resolução de quebra-cabeças
: 7.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)15.95sTempo de resposta (máx.)27.12sTempo de resposta (total)47.86s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.92sTempo de resposta (máx.)5.92sTempo de resposta (total)5.92s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.59sTempo de resposta (máx.)15.59sTempo de resposta (total)15.59s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)4.57sTempo de resposta (máx.)33.34sTempo de resposta (total)91.37s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.88sTempo de resposta (máx.)4.81sTempo de resposta (total)7.53s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)13.32sTempo de resposta (máx.)13.32sTempo de resposta (total)13.32s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.82sTempo de resposta (máx.)3.86sTempo de resposta (total)5.65s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)4.43sTempo de resposta (máx.)10.83sTempo de resposta (total)13.28s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.41sTempo de resposta (máx.)1.41sTempo de resposta (total)1.41s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.33sTempo de resposta (total)2.35s
Resolução de quebra-cabeças
: 6.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.97sTempo de resposta (máx.)3.43sTempo de resposta (total)5.91s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.42sTempo de resposta (máx.)4.42sTempo de resposta (total)4.42s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)33.34sTempo de resposta (máx.)33.34sTempo de resposta (total)33.34s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)3.50sTempo de resposta (máx.)47.43sTempo de resposta (total)70.00s…
Truques anti-IA
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.43sTempo de resposta (máx.)4.39sTempo de resposta (total)5.71s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.72sTempo de resposta (máx.)2.67sTempo de resposta (total)3.43s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.43sTempo de resposta (máx.)47.43sTempo de resposta (total)47.43s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.16sTempo de resposta (máx.)1.42sTempo de resposta (total)2.33s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)485msTempo de resposta (máx.)549msTempo de resposta (total)1.45s
Inteligência geral
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.19sTempo de resposta (máx.)1.19sTempo de resposta (total)1.19s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)809msTempo de resposta (máx.)983msTempo de resposta (total)1.62s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.30sTempo de resposta (máx.)2.30sTempo de resposta (total)2.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)493msTempo de resposta (máx.)493msTempo de resposta (total)493ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)1.69sTempo de resposta (máx.)9.39sTempo de resposta (total)33.82s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)788msTempo de resposta (máx.)1.34sTempo de resposta (total)3.15s
Programação
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.98sTempo de resposta (máx.)2.51sTempo de resposta (total)3.97s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)9.39sTempo de resposta (máx.)9.39sTempo de resposta (total)9.39s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.43sTempo de resposta (máx.)1.45sTempo de resposta (total)2.86s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)540msTempo de resposta (máx.)649msTempo de resposta (total)1.62s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.51sTempo de resposta (máx.)2.51sTempo de resposta (total)2.51s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.03sTempo de resposta (máx.)1.40sTempo de resposta (total)2.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)599msTempo de resposta (máx.)599msTempo de resposta (total)599ms
Truques anti-IA
: 3.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.83sTempo de resposta (máx.)7.62sTempo de resposta (total)11.33s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.75sTempo de resposta (máx.)10.18sTempo de resposta (total)11.51s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)9.95sTempo de resposta (máx.)9.95sTempo de resposta (total)9.95s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.06sTempo de resposta (máx.)2.39sTempo de resposta (total)4.11s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.03sTempo de resposta (máx.)4.83sTempo de resposta (total)9.08s
Inteligência geral
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.07sTempo de resposta (total)1.07s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.92sTempo de resposta (máx.)1.94sTempo de resposta (total)3.83s
Chamada de ferramentas
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.74sTempo de resposta (máx.)6.74sTempo de resposta (total)6.74s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.03sTempo de resposta (máx.)4.03sTempo de resposta (total)4.03s
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.00sTempo de resposta (máx.)11.53sTempo de resposta (total)39.99s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)47.38sTempo de resposta (máx.)47.38sTempo de resposta (total)47.38s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.36sTempo de resposta (máx.)26.57sTempo de resposta (total)34.71s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)128.15sTempo de resposta (máx.)309.02sTempo de resposta (total)384.46s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)23.23sTempo de resposta (máx.)23.23sTempo de resposta (total)23.23s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.60sTempo de resposta (máx.)14.49sTempo de resposta (total)23.20s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.19sTempo de resposta (máx.)11.19sTempo de resposta (total)11.19s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)36.98sTempo de resposta (máx.)36.98sTempo de resposta (total)36.98s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 11Não seguiu as instruções: 2Tempo de resposta (médio)2.27sTempo de resposta (máx.)6.58sTempo de resposta (total)45.50s…
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.80sTempo de resposta (máx.)2.62sTempo de resposta (total)7.19s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.65sTempo de resposta (máx.)3.82sTempo de resposta (total)5.30s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.58sTempo de resposta (máx.)6.58sTempo de resposta (total)6.58s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.39sTempo de resposta (máx.)1.42sTempo de resposta (total)2.78s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.78sTempo de resposta (máx.)2.49sTempo de resposta (total)5.34s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.44sTempo de resposta (máx.)2.44sTempo de resposta (total)2.44s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.51sTempo de resposta (máx.)2.95sTempo de resposta (total)5.02s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.39sTempo de resposta (máx.)4.39sTempo de resposta (total)4.39s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.63sTempo de resposta (máx.)1.63sTempo de resposta (total)1.63s
Programação
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)39.68sTempo de resposta (máx.)47.10sTempo de resposta (total)79.37s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)21.74sTempo de resposta (máx.)21.74sTempo de resposta (total)21.74s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.60sTempo de resposta (máx.)3.92sTempo de resposta (total)7.19s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.00sTempo de resposta (máx.)4.69sTempo de resposta (total)8.99s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.61sTempo de resposta (máx.)4.61sTempo de resposta (total)4.61s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.63sTempo de resposta (máx.)2.77sTempo de resposta (total)5.27s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)22.78sTempo de resposta (máx.)22.78sTempo de resposta (total)22.78s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.50sTempo de resposta (máx.)2.50sTempo de resposta (total)2.50s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 1Tempo de resposta (médio)1.45sTempo de resposta (máx.)2.95sTempo de resposta (total)29.00s…
Truques anti-IA
: 3.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.21sTempo de resposta (máx.)2.58sTempo de resposta (total)4.85s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.99sTempo de resposta (máx.)2.95sTempo de resposta (total)3.97s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.89sTempo de resposta (máx.)2.89sTempo de resposta (total)2.89s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.04sTempo de resposta (máx.)1.06sTempo de resposta (total)2.08s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.54sTempo de resposta (total)3.22s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.78sTempo de resposta (máx.)1.78sTempo de resposta (total)1.78s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.17sTempo de resposta (total)2.15s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.75sTempo de resposta (máx.)2.75sTempo de resposta (total)2.75s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)990msTempo de resposta (máx.)990msTempo de resposta (total)990ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Não seguiu as instruções: 3Tempo de resposta (médio)13.82sTempo de resposta (máx.)238.89sTempo de resposta (total)276.39s…
Truques anti-IA
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.39sTempo de resposta (máx.)2.96sTempo de resposta (total)5.56s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)122.77sTempo de resposta (máx.)238.89sTempo de resposta (total)245.54s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.38sTempo de resposta (máx.)3.38sTempo de resposta (total)3.38s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.32sTempo de resposta (máx.)1.39sTempo de resposta (total)2.64s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.48sTempo de resposta (máx.)1.85sTempo de resposta (total)4.45s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.55sTempo de resposta (máx.)1.55sTempo de resposta (total)1.55s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.64sTempo de resposta (máx.)1.80sTempo de resposta (total)3.28s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.46sTempo de resposta (máx.)4.46sTempo de resposta (total)4.46s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.36sTempo de resposta (máx.)1.36sTempo de resposta (total)1.36s
Truques anti-IA
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.63sTempo de resposta (máx.)4.60sTempo de resposta (total)6.51s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.34sTempo de resposta (máx.)2.46sTempo de resposta (total)4.68s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)4.22sTempo de resposta (máx.)4.22sTempo de resposta (total)4.22s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.13sTempo de resposta (máx.)3.35sTempo de resposta (total)4.26s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.89sTempo de resposta (total)3.32s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)947msTempo de resposta (máx.)947msTempo de resposta (total)947ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.10sTempo de resposta (máx.)1.36sTempo de resposta (total)2.19s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.49sTempo de resposta (máx.)2.49sTempo de resposta (total)2.49s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)649msTempo de resposta (máx.)649msTempo de resposta (total)649ms
Truques anti-IA
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)597msTempo de resposta (máx.)866msTempo de resposta (total)2.39s
Programação
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.14sTempo de resposta (máx.)1.14sTempo de resposta (total)1.14s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)6.48sTempo de resposta (máx.)6.48sTempo de resposta (total)6.48s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)601msTempo de resposta (máx.)634msTempo de resposta (total)1.20s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)611msTempo de resposta (máx.)616msTempo de resposta (total)1.83s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)541msTempo de resposta (máx.)541msTempo de resposta (total)541ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)649msTempo de resposta (máx.)952msTempo de resposta (total)1.30s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)586msTempo de resposta (máx.)813msTempo de resposta (total)1.76s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.79sTempo de resposta (máx.)4.79sTempo de resposta (total)4.79s