Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.82sTempo de resposta (máx.)7.69sTempo de resposta (total)19.26s
Programação
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)53.92sTempo de resposta (máx.)95.57sTempo de resposta (total)107.83s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.88sTempo de resposta (máx.)13.88sTempo de resposta (total)13.88s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.19sTempo de resposta (máx.)6.42sTempo de resposta (total)12.38s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.05sTempo de resposta (máx.)10.05sTempo de resposta (total)10.05s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.38sTempo de resposta (máx.)5.70sTempo de resposta (total)10.77s
Resolução de quebra-cabeças
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)5.23sTempo de resposta (máx.)7.26sTempo de resposta (total)15.69s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.84sTempo de resposta (máx.)9.84sTempo de resposta (total)9.84s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)40.17sTempo de resposta (máx.)40.17sTempo de resposta (total)40.17s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)6.82sTempo de resposta (máx.)38.52sTempo de resposta (total)136.34s…
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.40sTempo de resposta (máx.)4.78sTempo de resposta (total)13.59s
Programação
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.05sTempo de resposta (máx.)8.97sTempo de resposta (total)16.09s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.12sTempo de resposta (máx.)9.12sTempo de resposta (total)9.12s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.05sTempo de resposta (máx.)3.33sTempo de resposta (total)6.10s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)17.78sTempo de resposta (máx.)38.52sTempo de resposta (total)53.33s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.20sTempo de resposta (máx.)3.20sTempo de resposta (total)3.20s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.51sTempo de resposta (máx.)6.55sTempo de resposta (total)11.02s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.10sTempo de resposta (máx.)5.04sTempo de resposta (total)12.31s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.68sTempo de resposta (máx.)4.68sTempo de resposta (total)4.68s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.89sTempo de resposta (máx.)6.89sTempo de resposta (total)6.89s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.83sTempo de resposta (máx.)11.20sTempo de resposta (total)35.31s
Programação
: 7.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)55.26sTempo de resposta (máx.)64.81sTempo de resposta (total)110.53s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)63.99sTempo de resposta (máx.)63.99sTempo de resposta (total)63.99s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.97sTempo de resposta (máx.)26.99sTempo de resposta (total)37.93s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)181.74sTempo de resposta (máx.)216.69sTempo de resposta (total)545.21s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)24.70sTempo de resposta (máx.)24.70sTempo de resposta (total)24.70s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.58sTempo de resposta (máx.)31.48sTempo de resposta (total)37.15s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.66sTempo de resposta (máx.)17.66sTempo de resposta (total)17.66s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)44.47sTempo de resposta (máx.)44.47sTempo de resposta (total)44.47s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.90sTempo de resposta (máx.)19.37sTempo de resposta (total)39.60s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)201.68sTempo de resposta (máx.)201.68sTempo de resposta (total)201.68s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.95sTempo de resposta (máx.)34.95sTempo de resposta (total)34.95s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.95sTempo de resposta (máx.)15.40sTempo de resposta (total)29.90s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)29.59sTempo de resposta (máx.)43.55sTempo de resposta (total)88.77s
Inteligência geral
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)27.05sTempo de resposta (máx.)27.05sTempo de resposta (total)27.05s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.54sTempo de resposta (máx.)11.67sTempo de resposta (total)15.07s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.34sTempo de resposta (máx.)7.52sTempo de resposta (total)19.03s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.87sTempo de resposta (máx.)5.87sTempo de resposta (total)5.87s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.51sTempo de resposta (máx.)47.51sTempo de resposta (total)47.51s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)3.94sTempo de resposta (máx.)14.93sTempo de resposta (total)78.74s…
Truques anti-IA
: 9.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.33sTempo de resposta (máx.)3.89sTempo de resposta (total)9.30s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.98sTempo de resposta (máx.)4.34sTempo de resposta (total)7.95s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.93sTempo de resposta (máx.)14.93sTempo de resposta (total)14.93s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.29sTempo de resposta (máx.)2.31sTempo de resposta (total)4.59s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)4.21sTempo de resposta (máx.)5.86sTempo de resposta (total)12.62s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.16sTempo de resposta (máx.)3.16sTempo de resposta (total)3.16s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.91sTempo de resposta (máx.)1.93sTempo de resposta (total)3.82s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.30sTempo de resposta (máx.)9.55sTempo de resposta (total)15.89s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.80sTempo de resposta (máx.)3.80sTempo de resposta (total)3.80s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.68sTempo de resposta (máx.)2.68sTempo de resposta (total)2.68s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)3.18sTempo de resposta (máx.)10.87sTempo de resposta (total)63.55s…
Truques anti-IA
: 9.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.39sTempo de resposta (máx.)3.58sTempo de resposta (total)9.57s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.59sTempo de resposta (máx.)3.93sTempo de resposta (total)7.19s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.87sTempo de resposta (máx.)10.87sTempo de resposta (total)10.87s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.60sTempo de resposta (máx.)2.69sTempo de resposta (total)5.19s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)3.16sTempo de resposta (máx.)3.89sTempo de resposta (total)9.49s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.60sTempo de resposta (máx.)2.60sTempo de resposta (total)2.60s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.59sTempo de resposta (máx.)3.04sTempo de resposta (total)5.17s
Resolução de quebra-cabeças
: 7.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.95sTempo de resposta (máx.)2.48sTempo de resposta (total)5.84s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.55sTempo de resposta (máx.)4.55sTempo de resposta (total)4.55s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.08sTempo de resposta (máx.)3.08sTempo de resposta (total)3.08s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)15.57sTempo de resposta (máx.)95.48sTempo de resposta (total)311.47s…
Truques anti-IA
: 8.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.30sTempo de resposta (máx.)15.56sTempo de resposta (total)25.21s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)54.56sTempo de resposta (máx.)92.88sTempo de resposta (total)109.12s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)28.44sTempo de resposta (máx.)28.44sTempo de resposta (total)28.44s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.06sTempo de resposta (máx.)5.06sTempo de resposta (total)8.11s
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)37.34sTempo de resposta (máx.)95.48sTempo de resposta (total)112.01s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.86sTempo de resposta (máx.)4.86sTempo de resposta (total)4.86s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.62sTempo de resposta (máx.)2.78sTempo de resposta (total)5.24s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.18sTempo de resposta (máx.)4.05sTempo de resposta (total)9.54s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.20sTempo de resposta (máx.)6.20sTempo de resposta (total)6.20s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.76sTempo de resposta (máx.)2.76sTempo de resposta (total)2.76s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 5Tempo esgotado: 2Tempo de resposta (médio)39.40sTempo de resposta (máx.)168.16sTempo de resposta (total)788.00s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.75sTempo de resposta (máx.)18.03sTempo de resposta (total)39.01s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)119.57sTempo de resposta (máx.)168.16sTempo de resposta (total)239.14s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)107.79sTempo de resposta (máx.)107.79sTempo de resposta (total)107.79s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.41sTempo de resposta (máx.)29.79sTempo de resposta (total)46.83s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)63.40sTempo de resposta (máx.)119.29sTempo de resposta (total)190.20s
Inteligência geral
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)34.11sTempo de resposta (máx.)34.11sTempo de resposta (total)34.11s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.88sTempo de resposta (máx.)15.44sTempo de resposta (total)19.76s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.89sTempo de resposta (máx.)31.99sTempo de resposta (total)53.68s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.60sTempo de resposta (máx.)4.60sTempo de resposta (total)4.60s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)52.87sTempo de resposta (máx.)52.87sTempo de resposta (total)52.87s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Tempo de resposta (médio)1.70sTempo de resposta (máx.)3.56sTempo de resposta (total)22.05s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.25sTempo de resposta (máx.)1.59sTempo de resposta (total)2.49s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.19sTempo de resposta (máx.)2.79sTempo de resposta (total)4.38s
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.56sTempo de resposta (máx.)3.56sTempo de resposta (total)3.56s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.41sTempo de resposta (máx.)1.41sTempo de resposta (total)1.41s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)963msTempo de resposta (máx.)963msTempo de resposta (total)963ms
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.13sTempo de resposta (máx.)1.13sTempo de resposta (total)1.13s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.58sTempo de resposta (máx.)1.58sTempo de resposta (total)1.58s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.05sTempo de resposta (máx.)1.06sTempo de resposta (total)2.11s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.35sTempo de resposta (máx.)3.35sTempo de resposta (total)3.35s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.07sTempo de resposta (total)1.07s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Formatação extra: 3Tempo de resposta (médio)42.39sTempo de resposta (máx.)252.69sTempo de resposta (total)847.76s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)7.43sTempo de resposta (máx.)10.89sTempo de resposta (total)29.72s
Programação
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)62.62sTempo de resposta (máx.)94.25sTempo de resposta (total)125.23s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)32.81sTempo de resposta (máx.)32.81sTempo de resposta (total)32.81s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.72sTempo de resposta (máx.)12.13sTempo de resposta (total)21.44s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.41sTempo de resposta (máx.)18.41sTempo de resposta (total)18.41s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.36sTempo de resposta (máx.)20.80sTempo de resposta (total)24.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.26sTempo de resposta (máx.)44.40sTempo de resposta (total)54.79s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.12sTempo de resposta (máx.)13.12sTempo de resposta (total)13.12s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)53.51sTempo de resposta (máx.)53.51sTempo de resposta (total)53.51s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 1Tempo de resposta (médio)2.85sTempo de resposta (máx.)11.91sTempo de resposta (total)57.08s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.12sTempo de resposta (máx.)3.18sTempo de resposta (total)8.50s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.56sTempo de resposta (máx.)2.20sTempo de resposta (total)3.13s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)11.91sTempo de resposta (máx.)11.91sTempo de resposta (total)11.91s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.00sTempo de resposta (máx.)3.74sTempo de resposta (total)5.99s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.36sTempo de resposta (máx.)3.51sTempo de resposta (total)7.07s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.54sTempo de resposta (máx.)1.54sTempo de resposta (total)1.54s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.49sTempo de resposta (máx.)1.66sTempo de resposta (total)2.99s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.69sTempo de resposta (máx.)1.89sTempo de resposta (total)5.08s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.54sTempo de resposta (máx.)9.54sTempo de resposta (total)9.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.35sTempo de resposta (máx.)1.35sTempo de resposta (total)1.35s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Resposta incorreta: 1Tempo de resposta (médio)2.98sTempo de resposta (máx.)4.95sTempo de resposta (total)5.97s
Programação
: 7.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)33.87sTempo de resposta (máx.)35.76sTempo de resposta (total)67.74s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)46.35sTempo de resposta (máx.)46.35sTempo de resposta (total)46.35s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.90sTempo de resposta (máx.)13.90sTempo de resposta (total)13.90s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.94sTempo de resposta (máx.)4.94sTempo de resposta (total)4.94s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.61sTempo de resposta (máx.)2.61sTempo de resposta (total)2.61s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.31sTempo de resposta (máx.)6.24sTempo de resposta (total)10.62s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.48sTempo de resposta (máx.)7.48sTempo de resposta (total)7.48s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)30.09sTempo de resposta (máx.)30.09sTempo de resposta (total)30.09s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Não seguiu as instruções: 1Tempo de resposta (médio)18.97sTempo de resposta (máx.)122.87sTempo de resposta (total)379.49s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.10sTempo de resposta (máx.)9.60sTempo de resposta (total)24.39s
Programação
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)51.92sTempo de resposta (máx.)78.01sTempo de resposta (total)103.85s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.28sTempo de resposta (máx.)20.28sTempo de resposta (total)20.28s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.65sTempo de resposta (máx.)10.35sTempo de resposta (total)19.31s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)14.65sTempo de resposta (máx.)26.85sTempo de resposta (total)43.95s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)9.88sTempo de resposta (máx.)9.88sTempo de resposta (total)9.88s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.05sTempo de resposta (máx.)6.94sTempo de resposta (total)12.10s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.29sTempo de resposta (máx.)8.18sTempo de resposta (total)18.87s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.00sTempo de resposta (máx.)4.00sTempo de resposta (total)4.00s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)122.87sTempo de resposta (máx.)122.87sTempo de resposta (total)122.87s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 2Tempo de resposta (médio)46.36sTempo de resposta (máx.)218.13sTempo de resposta (total)927.27s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)28.51sTempo de resposta (máx.)39.73sTempo de resposta (total)114.05s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)58.13sTempo de resposta (máx.)62.48sTempo de resposta (total)116.27s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)76.57sTempo de resposta (máx.)76.57sTempo de resposta (total)76.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)28.03sTempo de resposta (máx.)30.49sTempo de resposta (total)56.07s
Específico do domínio
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)100.31sTempo de resposta (máx.)218.13sTempo de resposta (total)300.92s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)25.15sTempo de resposta (máx.)25.15sTempo de resposta (total)25.15s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.36sTempo de resposta (máx.)19.53sTempo de resposta (total)30.73s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)26.11sTempo de resposta (máx.)32.37sTempo de resposta (total)78.32s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)74.73sTempo de resposta (máx.)74.73sTempo de resposta (total)74.73s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)54.46sTempo de resposta (máx.)54.46sTempo de resposta (total)54.46s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.26sTempo de resposta (máx.)6.38sTempo de resposta (total)13.06s
Programação
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)81.67sTempo de resposta (máx.)130.77sTempo de resposta (total)163.34s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)53.36sTempo de resposta (máx.)53.36sTempo de resposta (total)53.36s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.81sTempo de resposta (máx.)20.29sTempo de resposta (total)37.61s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 2Tempo de resposta (médio)37.87sTempo de resposta (máx.)84.22sTempo de resposta (total)113.60s
Inteligência geral
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.02sTempo de resposta (máx.)4.02sTempo de resposta (total)4.02s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.77sTempo de resposta (máx.)3.21sTempo de resposta (total)5.54s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.87sTempo de resposta (máx.)16.87sTempo de resposta (total)16.87s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.46sTempo de resposta (máx.)12.46sTempo de resposta (total)12.46s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)59.11sTempo de resposta (máx.)168.31sTempo de resposta (total)236.44s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)54.23sTempo de resposta (máx.)62.72sTempo de resposta (total)108.47s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.78sTempo de resposta (máx.)17.78sTempo de resposta (total)17.78s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)56.99sTempo de resposta (máx.)80.14sTempo de resposta (total)113.98s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)40.05sTempo de resposta (máx.)40.05sTempo de resposta (total)40.05s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)63.49sTempo de resposta (máx.)111.61sTempo de resposta (total)126.98s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)27.61sTempo de resposta (máx.)31.84sTempo de resposta (total)55.21s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.33sTempo de resposta (máx.)10.33sTempo de resposta (total)10.33s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)48.98sTempo de resposta (máx.)48.98sTempo de resposta (total)48.98s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.86sTempo de resposta (máx.)3.92sTempo de resposta (total)11.45s
Programação
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)94.21sTempo de resposta (máx.)136.29sTempo de resposta (total)188.41s
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)64.71sTempo de resposta (máx.)64.71sTempo de resposta (total)64.71s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.20sTempo de resposta (máx.)17.44sTempo de resposta (total)34.40s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.92sTempo de resposta (máx.)4.92sTempo de resposta (total)4.92s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.36sTempo de resposta (máx.)4.35sTempo de resposta (total)6.72s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.19sTempo de resposta (máx.)8.19sTempo de resposta (total)8.19s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)82.71sTempo de resposta (máx.)82.71sTempo de resposta (total)82.71s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 8Tempo de resposta (médio)43.65sTempo de resposta (máx.)189.38sTempo de resposta (total)872.90s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.84sTempo de resposta (máx.)15.11sTempo de resposta (total)43.36s
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)137.55sTempo de resposta (máx.)189.38sTempo de resposta (total)275.10s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)92.41sTempo de resposta (máx.)92.41sTempo de resposta (total)92.41s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)38.32sTempo de resposta (máx.)41.70sTempo de resposta (total)76.63s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)53.10sTempo de resposta (máx.)90.70sTempo de resposta (total)159.30s
Inteligência geral
: 4.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)25.30sTempo de resposta (máx.)25.30sTempo de resposta (total)25.30s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.25sTempo de resposta (máx.)21.65sTempo de resposta (total)40.50s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.67sTempo de resposta (máx.)24.83sTempo de resposta (total)53.02s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.72sTempo de resposta (máx.)14.72sTempo de resposta (total)14.72s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)92.57sTempo de resposta (máx.)92.57sTempo de resposta (total)92.57s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 2Tempo de resposta (médio)1.23sTempo de resposta (máx.)3.39sTempo de resposta (total)24.68s…
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.06sTempo de resposta (máx.)1.47sTempo de resposta (total)2.13s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.20sTempo de resposta (máx.)3.20sTempo de resposta (total)3.20s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.22sTempo de resposta (máx.)1.33sTempo de resposta (total)2.44s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)942msTempo de resposta (máx.)1.12sTempo de resposta (total)2.83s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)741msTempo de resposta (máx.)741msTempo de resposta (total)741ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.13sTempo de resposta (máx.)1.14sTempo de resposta (total)2.27s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)900msTempo de resposta (máx.)962msTempo de resposta (total)2.70s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.39sTempo de resposta (máx.)3.39sTempo de resposta (total)3.39s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)814msTempo de resposta (máx.)814msTempo de resposta (total)814ms
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)118.23sTempo de resposta (máx.)129.50sTempo de resposta (total)236.47s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)40.96sTempo de resposta (máx.)40.96sTempo de resposta (total)40.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.38sTempo de resposta (máx.)22.88sTempo de resposta (total)40.76s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 2Tempo de resposta (médio)202.38sTempo de resposta (máx.)215.85sTempo de resposta (total)404.76s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.83sTempo de resposta (máx.)17.83sTempo de resposta (total)17.83s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.53sTempo de resposta (máx.)19.15sTempo de resposta (total)25.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.92sTempo de resposta (máx.)8.92sTempo de resposta (total)8.92s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)130.27sTempo de resposta (máx.)130.27sTempo de resposta (total)130.27s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 8Tempo de resposta (médio)1.92sTempo de resposta (máx.)5.66sTempo de resposta (total)38.45s…
Truques anti-IA
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.84sTempo de resposta (máx.)3.08sTempo de resposta (total)7.37s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.71sTempo de resposta (máx.)1.97sTempo de resposta (total)3.42s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.48sTempo de resposta (máx.)4.48sTempo de resposta (total)4.48s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.44sTempo de resposta (máx.)1.51sTempo de resposta (total)2.89s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.52sTempo de resposta (máx.)1.63sTempo de resposta (total)4.57s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.37sTempo de resposta (máx.)1.37sTempo de resposta (total)1.37s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.52sTempo de resposta (máx.)1.68sTempo de resposta (total)3.04s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.40sTempo de resposta (máx.)1.41sTempo de resposta (total)4.20s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.66sTempo de resposta (máx.)5.66sTempo de resposta (total)5.66s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.46sTempo de resposta (máx.)1.46sTempo de resposta (total)1.46s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.31sTempo de resposta (máx.)14.20sTempo de resposta (total)33.24s
Programação
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)145.56sTempo de resposta (máx.)172.60sTempo de resposta (total)291.12s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)43.11sTempo de resposta (máx.)43.11sTempo de resposta (total)43.11s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.33sTempo de resposta (máx.)9.40sTempo de resposta (total)18.66s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.95sTempo de resposta (máx.)20.95sTempo de resposta (total)20.95s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.47sTempo de resposta (máx.)10.16sTempo de resposta (total)14.94s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)31.64sTempo de resposta (máx.)46.04sTempo de resposta (total)94.91s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)29.40sTempo de resposta (máx.)29.40sTempo de resposta (total)29.40s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 2Tempo de resposta (médio)6.13sTempo de resposta (máx.)18.33sTempo de resposta (total)122.61s…
Programação
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.52sTempo de resposta (máx.)11.72sTempo de resposta (total)21.03s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.96sTempo de resposta (máx.)11.96sTempo de resposta (total)11.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.21sTempo de resposta (máx.)2.52sTempo de resposta (total)4.42s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)13.01sTempo de resposta (máx.)18.33sTempo de resposta (total)39.04s
Inteligência geral
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.99sTempo de resposta (máx.)1.99sTempo de resposta (total)1.99s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.51sTempo de resposta (máx.)4.60sTempo de resposta (total)7.01s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.99sTempo de resposta (máx.)3.16sTempo de resposta (total)8.97s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.36sTempo de resposta (máx.)8.36sTempo de resposta (total)8.36s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.38sTempo de resposta (máx.)4.38sTempo de resposta (total)4.38s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.14sTempo de resposta (máx.)12.41sTempo de resposta (total)16.57s
Programação
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)64.48sTempo de resposta (máx.)97.49sTempo de resposta (total)128.97s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.86sTempo de resposta (máx.)16.86sTempo de resposta (total)16.86s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)5.37sTempo de resposta (máx.)5.37sTempo de resposta (total)5.37s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.80sTempo de resposta (máx.)1.81sTempo de resposta (total)3.60s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)20.25sTempo de resposta (máx.)57.93sTempo de resposta (total)60.76s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.29sTempo de resposta (máx.)7.29sTempo de resposta (total)7.29s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)51.29sTempo de resposta (máx.)51.29sTempo de resposta (total)51.29s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Sem resposta: 1Tempo de resposta (médio)16.06sTempo de resposta (máx.)124.75sTempo de resposta (total)321.11s…
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.02sTempo de resposta (máx.)12.52sTempo de resposta (total)16.10s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.43sTempo de resposta (máx.)12.69sTempo de resposta (total)18.86s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.98sTempo de resposta (máx.)7.98sTempo de resposta (total)7.98s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.29sTempo de resposta (máx.)3.15sTempo de resposta (total)4.58s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)43.31sTempo de resposta (máx.)72.27sTempo de resposta (total)129.92s
Inteligência geral
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.00sTempo de resposta (máx.)7.00sTempo de resposta (total)7.00s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.58sTempo de resposta (máx.)1.80sTempo de resposta (total)3.16s
Resolução de quebra-cabeças
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.84sTempo de resposta (máx.)3.42sTempo de resposta (total)5.52s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.25sTempo de resposta (máx.)3.25sTempo de resposta (total)3.25s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)124.75sTempo de resposta (máx.)124.75sTempo de resposta (total)124.75s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.02sTempo de resposta (máx.)8.79sTempo de resposta (total)24.07s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)59.35sTempo de resposta (máx.)86.11sTempo de resposta (total)118.69s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.99sTempo de resposta (máx.)13.75sTempo de resposta (total)25.99s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)22.50sTempo de resposta (máx.)45.02sTempo de resposta (total)67.51s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)8.66sTempo de resposta (máx.)8.66sTempo de resposta (total)8.66s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.50sTempo de resposta (máx.)10.22sTempo de resposta (total)15.00s
Resolução de quebra-cabeças
: 8.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.95sTempo de resposta (máx.)8.42sTempo de resposta (total)17.84s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)32.90sTempo de resposta (máx.)32.90sTempo de resposta (total)32.90s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.15sTempo de resposta (máx.)31.19sTempo de resposta (total)46.30s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.06sTempo de resposta (máx.)14.06sTempo de resposta (total)14.06s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.15sTempo de resposta (máx.)3.15sTempo de resposta (total)3.15s
Inteligência geral
: 3.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.32sTempo de resposta (máx.)4.32sTempo de resposta (total)4.32s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.12sTempo de resposta (máx.)3.12sTempo de resposta (total)3.12s
Resolução de quebra-cabeças
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)5.80sTempo de resposta (máx.)6.45sTempo de resposta (total)11.61s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)10.30sTempo de resposta (máx.)10.30sTempo de resposta (total)10.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)28.18sTempo de resposta (máx.)28.18sTempo de resposta (total)28.18s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 2Tempo de resposta (médio)3.40sTempo de resposta (máx.)6.36sTempo de resposta (total)13.58s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.59sTempo de resposta (máx.)4.34sTempo de resposta (total)7.17s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.73sTempo de resposta (máx.)17.73sTempo de resposta (total)17.73s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.77sTempo de resposta (máx.)1.93sTempo de resposta (total)3.53s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.66sTempo de resposta (máx.)2.16sTempo de resposta (total)4.99s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.48sTempo de resposta (máx.)3.48sTempo de resposta (total)3.48s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.37sTempo de resposta (máx.)1.40sTempo de resposta (total)2.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)2.74sTempo de resposta (máx.)3.46sTempo de resposta (total)8.22s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.35sTempo de resposta (máx.)5.35sTempo de resposta (total)5.35s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)3.41sTempo de resposta (máx.)3.41sTempo de resposta (total)3.41s
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 2Tempo de resposta (médio)7.45sTempo de resposta (máx.)11.88sTempo de resposta (total)14.90s
Programação
: 7.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)29.37sTempo de resposta (máx.)35.63sTempo de resposta (total)58.74s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)76.66sTempo de resposta (máx.)76.66sTempo de resposta (total)76.66s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.37sTempo de resposta (máx.)7.37sTempo de resposta (total)7.37s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.04sTempo de resposta (máx.)5.04sTempo de resposta (total)5.04s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.43sTempo de resposta (máx.)2.43sTempo de resposta (total)2.43s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.71sTempo de resposta (máx.)4.75sTempo de resposta (total)9.41s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.73sTempo de resposta (máx.)9.73sTempo de resposta (total)9.73s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)63.24sTempo de resposta (máx.)63.24sTempo de resposta (total)63.24s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)40.57sTempo de resposta (máx.)110.43sTempo de resposta (total)121.72s
Programação
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)62.83sTempo de resposta (máx.)62.83sTempo de resposta (total)62.83s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)29.57sTempo de resposta (máx.)29.57sTempo de resposta (total)29.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.01sTempo de resposta (máx.)15.01sTempo de resposta (total)15.01s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)170.45sTempo de resposta (máx.)170.45sTempo de resposta (total)170.45s
Inteligência geral
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)22.39sTempo de resposta (máx.)22.39sTempo de resposta (total)22.39s
Seguimento de instruções
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.78sTempo de resposta (máx.)4.78sTempo de resposta (total)4.78s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.91sTempo de resposta (máx.)11.91sTempo de resposta (total)11.91s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)108.45sTempo de resposta (máx.)108.45sTempo de resposta (total)108.45s