Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)20.18sTempo de resposta (máx.)26.54sTempo de resposta (total)80.73s
Programação
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)24.47sTempo de resposta (máx.)24.90sTempo de resposta (total)48.94s
Combinado
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)111.96sTempo de resposta (máx.)111.96sTempo de resposta (total)111.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.79sTempo de resposta (máx.)23.85sTempo de resposta (total)47.57s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)19.73sTempo de resposta (máx.)27.66sTempo de resposta (total)59.18s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)23.74sTempo de resposta (máx.)23.74sTempo de resposta (total)23.74s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)17.54sTempo de resposta (máx.)18.51sTempo de resposta (total)35.08s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)77.93sTempo de resposta (máx.)77.93sTempo de resposta (total)77.93s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.07sTempo de resposta (máx.)3.07sTempo de resposta (total)3.07s
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.30sTempo de resposta (máx.)9.80sTempo de resposta (total)25.20s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.41sTempo de resposta (máx.)21.41sTempo de resposta (total)21.41s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.47sTempo de resposta (máx.)12.47sTempo de resposta (total)12.47s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.36sTempo de resposta (máx.)11.05sTempo de resposta (total)14.73s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)36.09sTempo de resposta (máx.)36.09sTempo de resposta (total)36.09s
Programação
: 6.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)54.73sTempo de resposta (máx.)91.27sTempo de resposta (total)109.46s
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)41.03sTempo de resposta (máx.)41.03sTempo de resposta (total)41.03s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)21.95sTempo de resposta (máx.)24.88sTempo de resposta (total)43.89s
Inteligência geral
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)38.70sTempo de resposta (máx.)38.70sTempo de resposta (total)38.70s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)12.05sTempo de resposta (máx.)12.05sTempo de resposta (total)12.05s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)22.77sTempo de resposta (máx.)22.77sTempo de resposta (total)22.77s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.66sTempo de resposta (máx.)25.06sTempo de resposta (total)47.32s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)89.47sTempo de resposta (máx.)99.85sTempo de resposta (total)178.93s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)28.96sTempo de resposta (máx.)28.96sTempo de resposta (total)28.96s
Análise e extração de dados
: 7.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)8.90sTempo de resposta (máx.)8.90sTempo de resposta (total)8.90s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)14.69sTempo de resposta (máx.)14.69sTempo de resposta (total)14.69s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.25sTempo de resposta (máx.)7.25sTempo de resposta (total)7.25s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.33sTempo de resposta (máx.)16.34sTempo de resposta (total)22.66s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.93sTempo de resposta (máx.)15.93sTempo de resposta (total)15.93s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)67.37sTempo de resposta (máx.)67.37sTempo de resposta (total)67.37s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.31sTempo de resposta (máx.)14.20sTempo de resposta (total)33.24s
Programação
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)145.56sTempo de resposta (máx.)172.60sTempo de resposta (total)291.12s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)43.11sTempo de resposta (máx.)43.11sTempo de resposta (total)43.11s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.33sTempo de resposta (máx.)9.40sTempo de resposta (total)18.66s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.95sTempo de resposta (máx.)20.95sTempo de resposta (total)20.95s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.47sTempo de resposta (máx.)10.16sTempo de resposta (total)14.94s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)31.64sTempo de resposta (máx.)46.04sTempo de resposta (total)94.91s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)29.40sTempo de resposta (máx.)29.40sTempo de resposta (total)29.40s
Programação
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)55.33sTempo de resposta (máx.)89.40sTempo de resposta (total)110.66s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)65.57sTempo de resposta (máx.)65.57sTempo de resposta (total)65.57s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)1.51sTempo de resposta (máx.)1.51sTempo de resposta (total)1.51s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Sem resposta: 1Tempo de resposta (médio)174.55sTempo de resposta (máx.)174.55sTempo de resposta (total)174.55s
Inteligência geral
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.14sTempo de resposta (máx.)18.14sTempo de resposta (total)18.14s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.97sTempo de resposta (máx.)2.97sTempo de resposta (total)2.97s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.95sTempo de resposta (máx.)15.95sTempo de resposta (total)15.95s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)11.13sTempo de resposta (máx.)11.13sTempo de resposta (total)11.13s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.89sTempo de resposta (máx.)26.66sTempo de resposta (total)51.55s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)110.94sTempo de resposta (máx.)150.90sTempo de resposta (total)221.87s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.11sTempo de resposta (máx.)21.94sTempo de resposta (total)42.21s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)38.48sTempo de resposta (máx.)68.92sTempo de resposta (total)115.43s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.57sTempo de resposta (máx.)9.57sTempo de resposta (total)9.57s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.76sTempo de resposta (máx.)17.53sTempo de resposta (total)25.52s
Resolução de quebra-cabeças
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)26.91sTempo de resposta (máx.)61.08sTempo de resposta (total)80.72s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)90.14sTempo de resposta (máx.)90.14sTempo de resposta (total)90.14s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 5Não seguiu as instruções: 2Tempo de resposta (médio)36.67sTempo de resposta (máx.)168.71sTempo de resposta (total)733.46s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.99sTempo de resposta (máx.)48.33sTempo de resposta (total)71.98s
Programação
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)107.65sTempo de resposta (máx.)140.81sTempo de resposta (total)215.30s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)37.67sTempo de resposta (máx.)37.67sTempo de resposta (total)37.67s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.07sTempo de resposta (máx.)12.19sTempo de resposta (total)18.14s
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)88.74sTempo de resposta (máx.)168.71sTempo de resposta (total)266.21s
Inteligência geral
: 6.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)18.25sTempo de resposta (máx.)18.25sTempo de resposta (total)18.25s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.26sTempo de resposta (máx.)9.02sTempo de resposta (total)14.52s
Resolução de quebra-cabeças
: 9.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)10.23sTempo de resposta (máx.)11.54sTempo de resposta (total)30.68s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.38sTempo de resposta (máx.)12.38sTempo de resposta (total)12.38s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)48.32sTempo de resposta (máx.)48.32sTempo de resposta (total)48.32s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo esgotado: 1Tempo de resposta (médio)36.84sTempo de resposta (máx.)178.04sTempo de resposta (total)736.86s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.58sTempo de resposta (máx.)12.75sTempo de resposta (total)34.33s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)122.40sTempo de resposta (máx.)178.04sTempo de resposta (total)244.81s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.24sTempo de resposta (máx.)65.24sTempo de resposta (total)65.24s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.75sTempo de resposta (máx.)23.18sTempo de resposta (total)43.49s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)45.35sTempo de resposta (máx.)88.89sTempo de resposta (total)136.04s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)25.48sTempo de resposta (máx.)25.48sTempo de resposta (total)25.48s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.13sTempo de resposta (máx.)17.18sTempo de resposta (total)32.26s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.38sTempo de resposta (máx.)19.42sTempo de resposta (total)49.14s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.02sTempo de resposta (máx.)15.02sTempo de resposta (total)15.02s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)91.07sTempo de resposta (máx.)91.07sTempo de resposta (total)91.07s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)37.88sTempo de resposta (máx.)332.10sTempo de resposta (total)757.66s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.66sTempo de resposta (máx.)6.74sTempo de resposta (total)18.65s
Programação
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)69.68sTempo de resposta (máx.)130.26sTempo de resposta (total)139.35s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)19.29sTempo de resposta (máx.)19.29sTempo de resposta (total)19.29s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.18sTempo de resposta (máx.)4.35sTempo de resposta (total)8.36s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)164.14sTempo de resposta (máx.)332.10sTempo de resposta (total)492.41s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.16sTempo de resposta (máx.)4.16sTempo de resposta (total)4.16s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.36sTempo de resposta (máx.)3.46sTempo de resposta (total)6.73s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.76sTempo de resposta (máx.)10.54sTempo de resposta (total)20.28s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.57sTempo de resposta (máx.)10.57sTempo de resposta (total)10.57s
Conhecimentos gerais
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)37.86sTempo de resposta (máx.)37.86sTempo de resposta (total)37.86s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.99sTempo de resposta (máx.)109.60sTempo de resposta (total)139.95s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Específico do domínio
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.54sTempo de resposta (máx.)34.54sTempo de resposta (total)34.54s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)14.37sTempo de resposta (máx.)14.37sTempo de resposta (total)14.37s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.30sTempo de resposta (máx.)9.30sTempo de resposta (total)9.30s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)114.12sTempo de resposta (máx.)114.12sTempo de resposta (total)114.12s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 5Tempo esgotado: 2Tempo de resposta (médio)39.40sTempo de resposta (máx.)168.16sTempo de resposta (total)788.00s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.75sTempo de resposta (máx.)18.03sTempo de resposta (total)39.01s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)119.57sTempo de resposta (máx.)168.16sTempo de resposta (total)239.14s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)107.79sTempo de resposta (máx.)107.79sTempo de resposta (total)107.79s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.41sTempo de resposta (máx.)29.79sTempo de resposta (total)46.83s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)63.40sTempo de resposta (máx.)119.29sTempo de resposta (total)190.20s
Inteligência geral
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)34.11sTempo de resposta (máx.)34.11sTempo de resposta (total)34.11s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.88sTempo de resposta (máx.)15.44sTempo de resposta (total)19.76s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.89sTempo de resposta (máx.)31.99sTempo de resposta (total)53.68s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.60sTempo de resposta (máx.)4.60sTempo de resposta (total)4.60s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)52.87sTempo de resposta (máx.)52.87sTempo de resposta (total)52.87s
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.00sTempo de resposta (máx.)11.53sTempo de resposta (total)39.99s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)47.38sTempo de resposta (máx.)47.38sTempo de resposta (total)47.38s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.36sTempo de resposta (máx.)26.57sTempo de resposta (total)34.71s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)128.15sTempo de resposta (máx.)309.02sTempo de resposta (total)384.46s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)23.23sTempo de resposta (máx.)23.23sTempo de resposta (total)23.23s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.60sTempo de resposta (máx.)14.49sTempo de resposta (total)23.20s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.19sTempo de resposta (máx.)11.19sTempo de resposta (total)11.19s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)36.98sTempo de resposta (máx.)36.98sTempo de resposta (total)36.98s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.75sTempo de resposta (máx.)4.59sTempo de resposta (total)10.98s
Programação
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Resposta incorreta: 1Tempo de resposta (médio)183.89sTempo de resposta (máx.)299.23sTempo de resposta (total)367.78s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)25.87sTempo de resposta (máx.)25.87sTempo de resposta (total)25.87s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.04sTempo de resposta (máx.)4.12sTempo de resposta (total)6.07s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.61sTempo de resposta (máx.)3.61sTempo de resposta (total)3.61s
Seguimento de instruções
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.99sTempo de resposta (máx.)7.14sTempo de resposta (total)9.99s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.98sTempo de resposta (máx.)13.98sTempo de resposta (total)13.98s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)234.19sTempo de resposta (máx.)234.19sTempo de resposta (total)234.19s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Formatação extra: 3Tempo de resposta (médio)42.39sTempo de resposta (máx.)252.69sTempo de resposta (total)847.76s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)7.43sTempo de resposta (máx.)10.89sTempo de resposta (total)29.72s
Programação
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)62.62sTempo de resposta (máx.)94.25sTempo de resposta (total)125.23s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)32.81sTempo de resposta (máx.)32.81sTempo de resposta (total)32.81s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.72sTempo de resposta (máx.)12.13sTempo de resposta (total)21.44s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.41sTempo de resposta (máx.)18.41sTempo de resposta (total)18.41s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.36sTempo de resposta (máx.)20.80sTempo de resposta (total)24.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)18.26sTempo de resposta (máx.)44.40sTempo de resposta (total)54.79s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.12sTempo de resposta (máx.)13.12sTempo de resposta (total)13.12s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)53.51sTempo de resposta (máx.)53.51sTempo de resposta (total)53.51s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)40.57sTempo de resposta (máx.)110.43sTempo de resposta (total)121.72s
Programação
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)62.83sTempo de resposta (máx.)62.83sTempo de resposta (total)62.83s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)29.57sTempo de resposta (máx.)29.57sTempo de resposta (total)29.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.01sTempo de resposta (máx.)15.01sTempo de resposta (total)15.01s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)170.45sTempo de resposta (máx.)170.45sTempo de resposta (total)170.45s
Inteligência geral
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)22.39sTempo de resposta (máx.)22.39sTempo de resposta (total)22.39s
Seguimento de instruções
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.78sTempo de resposta (máx.)4.78sTempo de resposta (total)4.78s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.91sTempo de resposta (máx.)11.91sTempo de resposta (total)11.91s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)108.45sTempo de resposta (máx.)108.45sTempo de resposta (total)108.45s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)25.50sTempo de resposta (máx.)37.73sTempo de resposta (total)51.00s
Programação
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)47.80sTempo de resposta (máx.)54.86sTempo de resposta (total)95.59s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.96sTempo de resposta (máx.)65.96sTempo de resposta (total)65.96s
Análise e extração de dados
: 3.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)21.42sTempo de resposta (máx.)21.42sTempo de resposta (total)21.42s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)17.51sTempo de resposta (máx.)17.51sTempo de resposta (total)17.51s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.64sTempo de resposta (máx.)15.64sTempo de resposta (total)15.64s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)33.30sTempo de resposta (máx.)33.30sTempo de resposta (total)33.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)20.13sTempo de resposta (máx.)20.13sTempo de resposta (total)20.13s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 8Tempo de resposta (médio)43.65sTempo de resposta (máx.)189.38sTempo de resposta (total)872.90s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)10.84sTempo de resposta (máx.)15.11sTempo de resposta (total)43.36s
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)137.55sTempo de resposta (máx.)189.38sTempo de resposta (total)275.10s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)92.41sTempo de resposta (máx.)92.41sTempo de resposta (total)92.41s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)38.32sTempo de resposta (máx.)41.70sTempo de resposta (total)76.63s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)53.10sTempo de resposta (máx.)90.70sTempo de resposta (total)159.30s
Inteligência geral
: 4.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)25.30sTempo de resposta (máx.)25.30sTempo de resposta (total)25.30s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.25sTempo de resposta (máx.)21.65sTempo de resposta (total)40.50s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.67sTempo de resposta (máx.)24.83sTempo de resposta (total)53.02s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.72sTempo de resposta (máx.)14.72sTempo de resposta (total)14.72s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)92.57sTempo de resposta (máx.)92.57sTempo de resposta (total)92.57s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 2Tempo de resposta (médio)46.36sTempo de resposta (máx.)218.13sTempo de resposta (total)927.27s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)28.51sTempo de resposta (máx.)39.73sTempo de resposta (total)114.05s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)58.13sTempo de resposta (máx.)62.48sTempo de resposta (total)116.27s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)76.57sTempo de resposta (máx.)76.57sTempo de resposta (total)76.57s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)28.03sTempo de resposta (máx.)30.49sTempo de resposta (total)56.07s
Específico do domínio
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)100.31sTempo de resposta (máx.)218.13sTempo de resposta (total)300.92s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)25.15sTempo de resposta (máx.)25.15sTempo de resposta (total)25.15s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.36sTempo de resposta (máx.)19.53sTempo de resposta (total)30.73s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)26.11sTempo de resposta (máx.)32.37sTempo de resposta (total)78.32s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)74.73sTempo de resposta (máx.)74.73sTempo de resposta (total)74.73s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)54.46sTempo de resposta (máx.)54.46sTempo de resposta (total)54.46s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.83sTempo de resposta (máx.)11.20sTempo de resposta (total)35.31s
Programação
: 7.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)55.26sTempo de resposta (máx.)64.81sTempo de resposta (total)110.53s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)63.99sTempo de resposta (máx.)63.99sTempo de resposta (total)63.99s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.97sTempo de resposta (máx.)26.99sTempo de resposta (total)37.93s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)181.74sTempo de resposta (máx.)216.69sTempo de resposta (total)545.21s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)24.70sTempo de resposta (máx.)24.70sTempo de resposta (total)24.70s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.58sTempo de resposta (máx.)31.48sTempo de resposta (total)37.15s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.66sTempo de resposta (máx.)17.66sTempo de resposta (total)17.66s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)44.47sTempo de resposta (máx.)44.47sTempo de resposta (total)44.47s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Sem resposta: 3Tempo de resposta (médio)49.43sTempo de resposta (máx.)192.75sTempo de resposta (total)988.58s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.40sTempo de resposta (máx.)45.73sTempo de resposta (total)53.58s
Programação
: 3.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Resposta incorreta: 1Tempo de resposta (médio)126.82sTempo de resposta (máx.)192.75sTempo de resposta (total)253.65s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.01sTempo de resposta (máx.)13.01sTempo de resposta (total)13.01s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.72sTempo de resposta (máx.)24.97sTempo de resposta (total)29.43s
Específico do domínio
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Sem resposta: 1Tempo de resposta (médio)149.64sTempo de resposta (máx.)163.21sTempo de resposta (total)448.91s
Inteligência geral
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.17sTempo de resposta (máx.)4.17sTempo de resposta (total)4.17s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.52sTempo de resposta (máx.)1.89sTempo de resposta (total)3.03s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)10.22sTempo de resposta (máx.)23.65sTempo de resposta (total)30.66s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.79sTempo de resposta (máx.)2.79sTempo de resposta (total)2.79s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)149.34sTempo de resposta (máx.)149.34sTempo de resposta (total)149.34s
Programação
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)125.80sTempo de resposta (máx.)125.80sTempo de resposta (total)125.80s
Combinado
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)60.39sTempo de resposta (máx.)60.39sTempo de resposta (total)60.39s
Análise e extração de dados
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)7.48sTempo de resposta (máx.)7.48sTempo de resposta (total)7.48s
Inteligência geral
: 3.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.63sTempo de resposta (máx.)6.63sTempo de resposta (total)6.63s
Seguimento de instruções
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)621msTempo de resposta (máx.)621msTempo de resposta (total)621ms
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.35sTempo de resposta (máx.)15.35sTempo de resposta (total)15.35s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)80.79sTempo de resposta (máx.)80.79sTempo de resposta (total)80.79s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo esgotado: 2Sem resposta: 1Tempo de resposta (médio)50.92sTempo de resposta (máx.)369.32sTempo de resposta (total)967.47s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.20sTempo de resposta (máx.)9.64sTempo de resposta (total)24.78s
Programação
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)258.40sTempo de resposta (máx.)369.32sTempo de resposta (total)516.79s
Combinado
: 9.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)73.55sTempo de resposta (máx.)73.55sTempo de resposta (total)73.55s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.51sTempo de resposta (máx.)20.57sTempo de resposta (total)33.02s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)29.76sTempo de resposta (máx.)29.76sTempo de resposta (total)29.76s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.54sTempo de resposta (máx.)21.25sTempo de resposta (total)35.08s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.79sTempo de resposta (máx.)6.85sTempo de resposta (total)17.36s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.01sTempo de resposta (máx.)9.01sTempo de resposta (total)9.01s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)180.87sTempo de resposta (máx.)180.87sTempo de resposta (total)180.87s
Truques anti-IA
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)24.23sTempo de resposta (máx.)29.86sTempo de resposta (total)96.93s
Programação
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)184.97sTempo de resposta (máx.)189.03sTempo de resposta (total)369.94s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)93.11sTempo de resposta (máx.)93.11sTempo de resposta (total)93.11s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)36.09sTempo de resposta (máx.)39.12sTempo de resposta (total)72.18s
Inteligência geral
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)58.29sTempo de resposta (máx.)58.29sTempo de resposta (total)58.29s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)35.78sTempo de resposta (máx.)47.30sTempo de resposta (total)71.56s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.81sTempo de resposta (máx.)34.81sTempo de resposta (total)34.81s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)83.99sTempo de resposta (máx.)83.99sTempo de resposta (total)83.99s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)118.23sTempo de resposta (máx.)129.50sTempo de resposta (total)236.47s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)40.96sTempo de resposta (máx.)40.96sTempo de resposta (total)40.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)20.38sTempo de resposta (máx.)22.88sTempo de resposta (total)40.76s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 2Tempo de resposta (médio)202.38sTempo de resposta (máx.)215.85sTempo de resposta (total)404.76s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.83sTempo de resposta (máx.)17.83sTempo de resposta (total)17.83s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.53sTempo de resposta (máx.)19.15sTempo de resposta (total)25.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.92sTempo de resposta (máx.)8.92sTempo de resposta (total)8.92s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)130.27sTempo de resposta (máx.)130.27sTempo de resposta (total)130.27s
Truques anti-IA
: 9.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)43.33sTempo de resposta (máx.)71.76sTempo de resposta (total)173.31s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)143.82sTempo de resposta (máx.)143.82sTempo de resposta (total)143.82s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)73.40sTempo de resposta (máx.)90.09sTempo de resposta (total)220.20s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.63sTempo de resposta (máx.)15.63sTempo de resposta (total)15.63s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)27.36sTempo de resposta (máx.)40.24sTempo de resposta (total)54.72s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)31.47sTempo de resposta (máx.)46.84sTempo de resposta (total)94.41s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)133.60sTempo de resposta (máx.)133.60sTempo de resposta (total)133.60s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 6Resposta incorreta: 3Tempo de resposta (médio)56.57sTempo de resposta (máx.)149.94sTempo de resposta (total)848.59s…
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 2Tempo de resposta (médio)15.12sTempo de resposta (máx.)19.99sTempo de resposta (total)45.37s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)99.76sTempo de resposta (máx.)99.76sTempo de resposta (total)99.76s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)113.09sTempo de resposta (máx.)113.09sTempo de resposta (total)113.09s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)12.11sTempo de resposta (máx.)12.11sTempo de resposta (total)12.11s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)109.04sTempo de resposta (máx.)149.94sTempo de resposta (total)327.11s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.36sTempo de resposta (máx.)41.83sTempo de resposta (total)68.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)27.94sTempo de resposta (máx.)45.06sTempo de resposta (total)55.89s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)78.83sTempo de resposta (máx.)78.83sTempo de resposta (total)78.83s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.71sTempo de resposta (máx.)47.71sTempo de resposta (total)47.71s
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.62sTempo de resposta (máx.)18.61sTempo de resposta (total)50.50s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)165.39sTempo de resposta (máx.)168.22sTempo de resposta (total)330.78s
Combinado
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)83.07sTempo de resposta (máx.)83.07sTempo de resposta (total)83.07s
Análise e extração de dados
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 2Tempo de resposta (médio)37.30sTempo de resposta (máx.)54.01sTempo de resposta (total)74.60s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)73.38sTempo de resposta (máx.)101.55sTempo de resposta (total)220.15s
Inteligência geral
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)39.53sTempo de resposta (máx.)39.53sTempo de resposta (total)39.53s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)37.96sTempo de resposta (máx.)47.48sTempo de resposta (total)75.92s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)61.14sTempo de resposta (máx.)97.76sTempo de resposta (total)183.42s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.88sTempo de resposta (máx.)16.88sTempo de resposta (total)16.88s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)80.99sTempo de resposta (máx.)80.99sTempo de resposta (total)80.99s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 5Tempo de resposta (médio)58.43sTempo de resposta (máx.)238.07sTempo de resposta (total)1168.66s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)22.13sTempo de resposta (máx.)28.70sTempo de resposta (total)88.50s
Programação
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)177.97sTempo de resposta (máx.)238.07sTempo de resposta (total)355.94s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)121.49sTempo de resposta (máx.)121.49sTempo de resposta (total)121.49s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)41.15sTempo de resposta (máx.)48.02sTempo de resposta (total)82.30s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)95.91sTempo de resposta (máx.)186.74sTempo de resposta (total)287.73s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)32.24sTempo de resposta (máx.)32.24sTempo de resposta (total)32.24s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)24.31sTempo de resposta (máx.)27.94sTempo de resposta (total)48.63s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)24.32sTempo de resposta (máx.)37.68sTempo de resposta (total)72.96s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.32sTempo de resposta (máx.)18.32sTempo de resposta (total)18.32s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)60.56sTempo de resposta (máx.)60.56sTempo de resposta (total)60.56s
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)16.53sTempo de resposta (máx.)39.91sTempo de resposta (total)66.11s
Programação
: 2.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo esgotado: 1Tempo de resposta (médio)51.77sTempo de resposta (máx.)51.77sTempo de resposta (total)51.77s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.02sTempo de resposta (máx.)65.02sTempo de resposta (total)65.02s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)23.62sTempo de resposta (máx.)36.44sTempo de resposta (total)47.24s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)25.09sTempo de resposta (máx.)25.09sTempo de resposta (total)25.09s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)41.16sTempo de resposta (máx.)43.56sTempo de resposta (total)82.32s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.33sTempo de resposta (máx.)21.33sTempo de resposta (total)21.33s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)39.14sTempo de resposta (máx.)39.14sTempo de resposta (total)39.14s