Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)37.16sTempo de resposta (máx.)140.53sTempo de resposta (total)148.65s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)137.63sTempo de resposta (máx.)137.63sTempo de resposta (total)137.63s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)149.23sTempo de resposta (máx.)149.23sTempo de resposta (total)149.23s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.49sTempo de resposta (máx.)4.96sTempo de resposta (total)8.98s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)139.90sTempo de resposta (máx.)141.40sTempo de resposta (total)419.69s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)45.69sTempo de resposta (máx.)45.69sTempo de resposta (total)45.69s
Seguimento de instruções
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)23.26sTempo de resposta (máx.)43.87sTempo de resposta (total)46.51s
Resolução de quebra-cabeças
: 5.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 2Tempo de resposta (médio)50.83sTempo de resposta (máx.)144.85sTempo de resposta (total)152.49s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.44sTempo de resposta (máx.)6.44sTempo de resposta (total)6.44s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)54.83sTempo de resposta (máx.)95.88sTempo de resposta (total)109.65s
Combinado
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)15.06sTempo de resposta (máx.)15.06sTempo de resposta (total)15.06s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.60sTempo de resposta (máx.)9.92sTempo de resposta (total)19.19s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)38.15sTempo de resposta (máx.)67.08sTempo de resposta (total)114.45s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.09sTempo de resposta (máx.)11.09sTempo de resposta (total)11.09s
Seguimento de instruções
: 9.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.74sTempo de resposta (máx.)5.23sTempo de resposta (total)7.47s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.24sTempo de resposta (máx.)16.95sTempo de resposta (total)30.72s
Chamada de ferramentas
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)12.53sTempo de resposta (máx.)12.53sTempo de resposta (total)12.53s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)40.96sTempo de resposta (máx.)40.96sTempo de resposta (total)40.96s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Não seguiu as instruções: 3Tempo de resposta (médio)22.10sTempo de resposta (máx.)138.75sTempo de resposta (total)442.09s…
Truques anti-IA
: 8.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.05sTempo de resposta (máx.)6.69sTempo de resposta (total)16.20s
Programação
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)73.25sTempo de resposta (máx.)138.75sTempo de resposta (total)146.51s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.81sTempo de resposta (máx.)17.81sTempo de resposta (total)17.81s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.43sTempo de resposta (máx.)3.39sTempo de resposta (total)4.87s
Específico do domínio
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)65.31sTempo de resposta (máx.)102.91sTempo de resposta (total)195.92s
Inteligência geral
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.72sTempo de resposta (máx.)3.72sTempo de resposta (total)3.72s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.13sTempo de resposta (máx.)2.45sTempo de resposta (total)4.25s
Resolução de quebra-cabeças
: 7.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.37sTempo de resposta (máx.)7.27sTempo de resposta (total)13.11s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)9.62sTempo de resposta (máx.)9.62sTempo de resposta (total)9.62s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)30.10sTempo de resposta (máx.)30.10sTempo de resposta (total)30.10s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)21.13sTempo de resposta (máx.)34.96sTempo de resposta (total)84.53s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)244.54sTempo de resposta (máx.)409.98sTempo de resposta (total)489.08s
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)75.34sTempo de resposta (máx.)75.34sTempo de resposta (total)75.34s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)59.33sTempo de resposta (máx.)97.12sTempo de resposta (total)118.65s
Inteligência geral
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)30.30sTempo de resposta (máx.)30.30sTempo de resposta (total)30.30s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)24.45sTempo de resposta (máx.)43.36sTempo de resposta (total)48.89s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)33.13sTempo de resposta (máx.)64.81sTempo de resposta (total)99.38s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.65sTempo de resposta (máx.)4.65sTempo de resposta (total)4.65s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)177.35sTempo de resposta (máx.)177.35sTempo de resposta (total)177.35s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Não seguiu as instruções: 2Tempo de resposta (médio)11.79sTempo de resposta (máx.)94.06sTempo de resposta (total)235.81s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.52sTempo de resposta (máx.)7.74sTempo de resposta (total)18.10s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)21.10sTempo de resposta (máx.)28.80sTempo de resposta (total)42.21s
Combinado
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)24.13sTempo de resposta (máx.)24.13sTempo de resposta (total)24.13s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.54sTempo de resposta (máx.)3.33sTempo de resposta (total)5.08s
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)38.18sTempo de resposta (máx.)94.06sTempo de resposta (total)114.53s
Inteligência geral
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.15sTempo de resposta (máx.)4.15sTempo de resposta (total)4.15s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.88sTempo de resposta (máx.)2.61sTempo de resposta (total)3.75s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.71sTempo de resposta (máx.)7.71sTempo de resposta (total)7.71s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.81sTempo de resposta (máx.)4.81sTempo de resposta (total)4.81s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 6Sem resposta: 3Tempo de resposta (médio)49.43sTempo de resposta (máx.)192.75sTempo de resposta (total)988.58s…
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.40sTempo de resposta (máx.)45.73sTempo de resposta (total)53.58s
Programação
: 3.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Resposta incorreta: 1Tempo de resposta (médio)126.82sTempo de resposta (máx.)192.75sTempo de resposta (total)253.65s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.01sTempo de resposta (máx.)13.01sTempo de resposta (total)13.01s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.72sTempo de resposta (máx.)24.97sTempo de resposta (total)29.43s
Específico do domínio
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Sem resposta: 1Tempo de resposta (médio)149.64sTempo de resposta (máx.)163.21sTempo de resposta (total)448.91s
Inteligência geral
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.17sTempo de resposta (máx.)4.17sTempo de resposta (total)4.17s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.52sTempo de resposta (máx.)1.89sTempo de resposta (total)3.03s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)10.22sTempo de resposta (máx.)23.65sTempo de resposta (total)30.66s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.79sTempo de resposta (máx.)2.79sTempo de resposta (total)2.79s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)149.34sTempo de resposta (máx.)149.34sTempo de resposta (total)149.34s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Tempo de resposta (médio)185.58sTempo de resposta (máx.)218.40sTempo de resposta (total)371.16s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)65.30sTempo de resposta (máx.)65.30sTempo de resposta (total)65.30s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.92sTempo de resposta (máx.)16.89sTempo de resposta (total)29.85s
Específico do domínio
: 5.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 2Tempo de resposta (médio)233.13sTempo de resposta (máx.)431.03sTempo de resposta (total)466.26s
Inteligência geral
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)33.25sTempo de resposta (máx.)33.25sTempo de resposta (total)33.25s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.14sTempo de resposta (máx.)6.80sTempo de resposta (total)12.27s
Resolução de quebra-cabeças
: 7.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)49.91sTempo de resposta (máx.)128.09sTempo de resposta (total)149.74s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.91sTempo de resposta (máx.)11.91sTempo de resposta (total)11.91s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)100.80sTempo de resposta (máx.)100.80sTempo de resposta (total)100.80s
Programação
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)30.74sTempo de resposta (máx.)38.31sTempo de resposta (total)61.49s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)88.15sTempo de resposta (máx.)88.15sTempo de resposta (total)88.15s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)12.58sTempo de resposta (máx.)13.87sTempo de resposta (total)25.16s
Inteligência geral
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)13.50sTempo de resposta (máx.)13.50sTempo de resposta (total)13.50s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.59sTempo de resposta (máx.)13.66sTempo de resposta (total)23.18s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)18.64sTempo de resposta (máx.)18.64sTempo de resposta (total)18.64s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)9.99sTempo de resposta (máx.)9.99sTempo de resposta (total)9.99s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 9Tempo de resposta (médio)3.31sTempo de resposta (máx.)20.51sTempo de resposta (total)66.17s…
Truques anti-IA
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.63sTempo de resposta (máx.)5.57sTempo de resposta (total)10.53s
Programação
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.06sTempo de resposta (máx.)3.45sTempo de resposta (total)6.12s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)20.51sTempo de resposta (máx.)20.51sTempo de resposta (total)20.51s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.87sTempo de resposta (máx.)3.54sTempo de resposta (total)5.74s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.22sTempo de resposta (máx.)1.25sTempo de resposta (total)3.67s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.62sTempo de resposta (máx.)1.62sTempo de resposta (total)1.62s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.40sTempo de resposta (máx.)1.46sTempo de resposta (total)2.79s
Resolução de quebra-cabeças
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.65sTempo de resposta (máx.)3.59sTempo de resposta (total)7.94s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.27sTempo de resposta (máx.)5.27sTempo de resposta (total)5.27s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.97sTempo de resposta (máx.)1.97sTempo de resposta (total)1.97s
Truques anti-IA
: 8.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)15.85sTempo de resposta (máx.)20.83sTempo de resposta (total)47.55s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)7.20sTempo de resposta (máx.)13.03sTempo de resposta (total)14.41s
Combinado
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)75.68sTempo de resposta (máx.)75.68sTempo de resposta (total)75.68s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)96.01sTempo de resposta (máx.)96.01sTempo de resposta (total)96.01s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.20sTempo de resposta (máx.)4.20sTempo de resposta (total)4.20s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.28sTempo de resposta (máx.)7.37sTempo de resposta (total)8.55s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.87sTempo de resposta (máx.)5.26sTempo de resposta (total)7.74s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)27.78sTempo de resposta (máx.)27.78sTempo de resposta (total)27.78s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.96sTempo de resposta (máx.)1.96sTempo de resposta (total)1.96s
Truques anti-IA
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)74.75sTempo de resposta (máx.)182.10sTempo de resposta (total)298.98s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)220.48sTempo de resposta (máx.)243.66sTempo de resposta (total)440.97s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)262.83sTempo de resposta (máx.)262.83sTempo de resposta (total)262.83s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)24.27sTempo de resposta (máx.)27.52sTempo de resposta (total)48.54s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 3Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Inteligência geral
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)36.65sTempo de resposta (máx.)36.65sTempo de resposta (total)36.65s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.47sTempo de resposta (máx.)19.46sTempo de resposta (total)34.93s
Resolução de quebra-cabeças
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)31.79sTempo de resposta (máx.)50.78sTempo de resposta (total)95.38s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)88.68sTempo de resposta (máx.)88.68sTempo de resposta (total)88.68s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)56.76sTempo de resposta (máx.)56.76sTempo de resposta (total)56.76s
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 2Resposta incorreta: 1Tempo de resposta (médio)2.94sTempo de resposta (máx.)4.83sTempo de resposta (total)5.88s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)6.73sTempo de resposta (máx.)9.79sTempo de resposta (total)13.46s
Combinado
: 9.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.84sTempo de resposta (máx.)23.84sTempo de resposta (total)23.84s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.43sTempo de resposta (máx.)3.43sTempo de resposta (total)3.43s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.56sTempo de resposta (máx.)2.56sTempo de resposta (total)2.56s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.96sTempo de resposta (máx.)1.96sTempo de resposta (total)1.96s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)2.53sTempo de resposta (máx.)2.54sTempo de resposta (total)5.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.11sTempo de resposta (máx.)4.11sTempo de resposta (total)4.11s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.67sTempo de resposta (máx.)4.67sTempo de resposta (total)4.67s
Truques anti-IA
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.95sTempo de resposta (máx.)5.68sTempo de resposta (total)15.80s
Programação
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)65.07sTempo de resposta (máx.)105.80sTempo de resposta (total)130.13s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)17.40sTempo de resposta (máx.)17.40sTempo de resposta (total)17.40s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.17sTempo de resposta (máx.)5.02sTempo de resposta (total)8.34s
Inteligência geral
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)24.48sTempo de resposta (máx.)24.48sTempo de resposta (total)24.48s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.26sTempo de resposta (máx.)4.46sTempo de resposta (total)8.52s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.22sTempo de resposta (máx.)11.63sTempo de resposta (total)18.66s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)13.68sTempo de resposta (máx.)13.68sTempo de resposta (total)13.68s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)63.48sTempo de resposta (máx.)63.48sTempo de resposta (total)63.48s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)42.21sTempo de resposta (máx.)89.34sTempo de resposta (total)168.84s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)59.65sTempo de resposta (máx.)59.65sTempo de resposta (total)59.65s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)304.19sTempo de resposta (máx.)304.19sTempo de resposta (total)304.19s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)37.36sTempo de resposta (máx.)54.24sTempo de resposta (total)74.71s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)64.92sTempo de resposta (máx.)150.55sTempo de resposta (total)194.76s
Inteligência geral
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)58.26sTempo de resposta (máx.)58.26sTempo de resposta (total)58.26s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.78sTempo de resposta (máx.)17.75sTempo de resposta (total)23.55s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)104.44sTempo de resposta (máx.)104.44sTempo de resposta (total)104.44s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)113.91sTempo de resposta (máx.)113.91sTempo de resposta (total)113.91s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 6Resposta incorreta: 3Tempo de resposta (médio)56.57sTempo de resposta (máx.)149.94sTempo de resposta (total)848.59s…
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 2Tempo de resposta (médio)15.12sTempo de resposta (máx.)19.99sTempo de resposta (total)45.37s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)99.76sTempo de resposta (máx.)99.76sTempo de resposta (total)99.76s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)113.09sTempo de resposta (máx.)113.09sTempo de resposta (total)113.09s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)12.11sTempo de resposta (máx.)12.11sTempo de resposta (total)12.11s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)109.04sTempo de resposta (máx.)149.94sTempo de resposta (total)327.11s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.36sTempo de resposta (máx.)41.83sTempo de resposta (total)68.73s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)27.94sTempo de resposta (máx.)45.06sTempo de resposta (total)55.89s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)78.83sTempo de resposta (máx.)78.83sTempo de resposta (total)78.83s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.71sTempo de resposta (máx.)47.71sTempo de resposta (total)47.71s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.75sTempo de resposta (máx.)4.59sTempo de resposta (total)10.98s
Programação
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Resposta incorreta: 1Tempo de resposta (médio)183.89sTempo de resposta (máx.)299.23sTempo de resposta (total)367.78s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)25.87sTempo de resposta (máx.)25.87sTempo de resposta (total)25.87s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.04sTempo de resposta (máx.)4.12sTempo de resposta (total)6.07s
Inteligência geral
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.61sTempo de resposta (máx.)3.61sTempo de resposta (total)3.61s
Seguimento de instruções
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.99sTempo de resposta (máx.)7.14sTempo de resposta (total)9.99s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.98sTempo de resposta (máx.)13.98sTempo de resposta (total)13.98s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)234.19sTempo de resposta (máx.)234.19sTempo de resposta (total)234.19s
Truques anti-IA
: 8.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)24.23sTempo de resposta (máx.)29.86sTempo de resposta (total)96.93s
Programação
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)184.97sTempo de resposta (máx.)189.03sTempo de resposta (total)369.94s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)93.11sTempo de resposta (máx.)93.11sTempo de resposta (total)93.11s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)36.09sTempo de resposta (máx.)39.12sTempo de resposta (total)72.18s
Inteligência geral
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)58.29sTempo de resposta (máx.)58.29sTempo de resposta (total)58.29s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)35.78sTempo de resposta (máx.)47.30sTempo de resposta (total)71.56s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.81sTempo de resposta (máx.)34.81sTempo de resposta (total)34.81s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)83.99sTempo de resposta (máx.)83.99sTempo de resposta (total)83.99s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.85sTempo de resposta (máx.)4.45sTempo de resposta (total)7.40s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)14.84sTempo de resposta (máx.)26.13sTempo de resposta (total)29.68s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.25sTempo de resposta (máx.)3.02sTempo de resposta (total)4.51s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.22sTempo de resposta (máx.)4.68sTempo de resposta (total)9.67s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.09sTempo de resposta (máx.)2.09sTempo de resposta (total)2.09s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.84sTempo de resposta (máx.)4.45sTempo de resposta (total)5.68s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.25sTempo de resposta (máx.)1.25sTempo de resposta (total)1.25s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 7Não seguiu as instruções: 3Tempo de resposta (médio)1.37sTempo de resposta (máx.)4.49sTempo de resposta (total)27.32s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.10sTempo de resposta (máx.)1.65sTempo de resposta (total)4.42s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)951msTempo de resposta (máx.)1.31sTempo de resposta (total)1.90s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.53sTempo de resposta (máx.)2.53sTempo de resposta (total)2.53s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.04sTempo de resposta (máx.)1.32sTempo de resposta (total)2.07s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.02sTempo de resposta (máx.)1.16sTempo de resposta (total)3.06s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)791msTempo de resposta (máx.)791msTempo de resposta (total)791ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)932msTempo de resposta (máx.)1.00sTempo de resposta (total)1.86s
Resolução de quebra-cabeças
: 6.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 2Tempo de resposta (médio)2.15sTempo de resposta (máx.)4.49sTempo de resposta (total)6.45s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.51sTempo de resposta (máx.)3.51sTempo de resposta (total)3.51s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)724msTempo de resposta (máx.)724msTempo de resposta (total)724ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 9Não seguiu as instruções: 1Tempo de resposta (médio)2.95sTempo de resposta (máx.)29.38sTempo de resposta (total)58.96s…
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.38sTempo de resposta (máx.)2.69sTempo de resposta (total)5.51s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.77sTempo de resposta (máx.)4.39sTempo de resposta (total)5.54s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)29.38sTempo de resposta (máx.)29.38sTempo de resposta (total)29.38s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.43sTempo de resposta (máx.)1.57sTempo de resposta (total)2.86s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)868msTempo de resposta (máx.)1.02sTempo de resposta (total)2.60s
Inteligência geral
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.33sTempo de resposta (máx.)1.33sTempo de resposta (total)1.33s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)929msTempo de resposta (máx.)1.05sTempo de resposta (total)1.86s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.71sTempo de resposta (máx.)2.65sTempo de resposta (total)5.13s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.21sTempo de resposta (máx.)1.21sTempo de resposta (total)1.21s
Truques anti-IA
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.99sTempo de resposta (máx.)109.60sTempo de resposta (total)139.95s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Específico do domínio
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.54sTempo de resposta (máx.)34.54sTempo de resposta (total)34.54s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)14.37sTempo de resposta (máx.)14.37sTempo de resposta (total)14.37s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)9.30sTempo de resposta (máx.)9.30sTempo de resposta (total)9.30s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)114.12sTempo de resposta (máx.)114.12sTempo de resposta (total)114.12s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 6Resposta incorreta: 4Tempo de resposta (médio)24.56sTempo de resposta (máx.)78.74sTempo de resposta (total)368.35s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)9.32sTempo de resposta (máx.)12.36sTempo de resposta (total)27.96s
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)27.94sTempo de resposta (máx.)27.94sTempo de resposta (total)27.94s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)78.74sTempo de resposta (máx.)78.74sTempo de resposta (total)78.74s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)5.85sTempo de resposta (máx.)5.85sTempo de resposta (total)5.85s
Específico do domínio
: 5.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)40.44sTempo de resposta (máx.)46.32sTempo de resposta (total)121.31s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.98sTempo de resposta (máx.)22.24sTempo de resposta (total)31.97s
Chamada de ferramentas
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)17.84sTempo de resposta (máx.)17.84sTempo de resposta (total)17.84s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)41.74sTempo de resposta (máx.)41.74sTempo de resposta (total)41.74s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Tempo de resposta (médio)1.93sTempo de resposta (máx.)5.56sTempo de resposta (total)38.64s…
Truques anti-IA
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.31sTempo de resposta (máx.)2.08sTempo de resposta (total)5.25s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.52sTempo de resposta (máx.)2.05sTempo de resposta (total)3.04s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.56sTempo de resposta (máx.)5.56sTempo de resposta (total)5.56s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.18sTempo de resposta (máx.)1.24sTempo de resposta (total)2.37s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.31sTempo de resposta (máx.)1.39sTempo de resposta (total)3.92s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.41sTempo de resposta (máx.)3.41sTempo de resposta (total)3.41s
Seguimento de instruções
: 6.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.15sTempo de resposta (máx.)1.19sTempo de resposta (total)2.31s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.29sTempo de resposta (máx.)1.56sTempo de resposta (total)3.87s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.90sTempo de resposta (máx.)3.90sTempo de resposta (total)3.90s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.01sTempo de resposta (máx.)5.01sTempo de resposta (total)5.01s
Truques anti-IA
: 8.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.81sTempo de resposta (máx.)5.65sTempo de resposta (total)7.62s
Programação
: 2.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)23.58sTempo de resposta (máx.)23.58sTempo de resposta (total)23.58s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)37.64sTempo de resposta (máx.)37.64sTempo de resposta (total)37.64s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.63sTempo de resposta (máx.)6.63sTempo de resposta (total)6.63s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)16.25sTempo de resposta (máx.)16.25sTempo de resposta (total)16.25s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)4.63sTempo de resposta (máx.)4.63sTempo de resposta (total)4.63s
Chamada de ferramentas
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)27.71sTempo de resposta (máx.)27.71sTempo de resposta (total)27.71s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)25.52sTempo de resposta (máx.)25.52sTempo de resposta (total)25.52s
Truques anti-IA
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)4.87sTempo de resposta (máx.)6.30sTempo de resposta (total)14.62s
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)35.61sTempo de resposta (máx.)35.61sTempo de resposta (total)35.61s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)53.14sTempo de resposta (máx.)53.14sTempo de resposta (total)53.14s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.93sTempo de resposta (máx.)5.03sTempo de resposta (total)9.86s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)24.14sTempo de resposta (máx.)45.83sTempo de resposta (total)72.43s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.30sTempo de resposta (máx.)6.00sTempo de resposta (total)8.59s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.31sTempo de resposta (máx.)6.31sTempo de resposta (total)6.31s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 8Resposta incorreta: 2Tempo de resposta (médio)15.25sTempo de resposta (máx.)43.55sTempo de resposta (total)182.96s…
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)11.69sTempo de resposta (máx.)19.37sTempo de resposta (total)35.08s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)34.95sTempo de resposta (máx.)34.95sTempo de resposta (total)34.95s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)14.95sTempo de resposta (máx.)15.40sTempo de resposta (total)29.90s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Erro de API: 1Tempo de resposta (médio)22.08sTempo de resposta (máx.)43.55sTempo de resposta (total)66.23s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)3.40sTempo de resposta (máx.)3.40sTempo de resposta (total)3.40s
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 2Tempo de resposta (médio)7.52sTempo de resposta (máx.)7.52sTempo de resposta (total)7.52s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.87sTempo de resposta (máx.)5.87sTempo de resposta (total)5.87s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Truques anti-IA
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Resposta incorreta: 1Tempo de resposta (médio)51.38sTempo de resposta (máx.)85.28sTempo de resposta (total)102.75s
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo esgotado: 1Tempo de resposta (médio)215.89sTempo de resposta (máx.)281.00sTempo de resposta (total)431.77s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)71.37sTempo de resposta (máx.)71.37sTempo de resposta (total)71.37s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)49.78sTempo de resposta (máx.)49.78sTempo de resposta (total)49.78s
Inteligência geral
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)69.73sTempo de resposta (máx.)69.73sTempo de resposta (total)69.73s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)92.47sTempo de resposta (máx.)92.47sTempo de resposta (total)92.47s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)31.74sTempo de resposta (máx.)31.74sTempo de resposta (total)31.74s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)83.95sTempo de resposta (máx.)83.95sTempo de resposta (total)83.95s
Truques anti-IA
: 8.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)12.62sTempo de resposta (máx.)18.61sTempo de resposta (total)50.50s
Programação
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)165.39sTempo de resposta (máx.)168.22sTempo de resposta (total)330.78s
Combinado
: 7.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)83.07sTempo de resposta (máx.)83.07sTempo de resposta (total)83.07s
Análise e extração de dados
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 2Tempo de resposta (médio)37.30sTempo de resposta (máx.)54.01sTempo de resposta (total)74.60s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)73.38sTempo de resposta (máx.)101.55sTempo de resposta (total)220.15s
Inteligência geral
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)39.53sTempo de resposta (máx.)39.53sTempo de resposta (total)39.53s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)37.96sTempo de resposta (máx.)47.48sTempo de resposta (total)75.92s
Resolução de quebra-cabeças
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)61.14sTempo de resposta (máx.)97.76sTempo de resposta (total)183.42s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)16.88sTempo de resposta (máx.)16.88sTempo de resposta (total)16.88s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)80.99sTempo de resposta (máx.)80.99sTempo de resposta (total)80.99s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Não seguiu as instruções: 1Tempo de resposta (médio)1.09sTempo de resposta (máx.)2.97sTempo de resposta (total)21.79s…
Truques anti-IA
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.91sTempo de resposta (total)4.27s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.13sTempo de resposta (máx.)1.59sTempo de resposta (total)2.26s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.73sTempo de resposta (máx.)2.73sTempo de resposta (total)2.73s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)843msTempo de resposta (máx.)907msTempo de resposta (total)1.69s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)762msTempo de resposta (máx.)814msTempo de resposta (total)2.29s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)992msTempo de resposta (máx.)992msTempo de resposta (total)992ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)859msTempo de resposta (máx.)975msTempo de resposta (total)1.72s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.97sTempo de resposta (máx.)2.97sTempo de resposta (total)2.97s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)733msTempo de resposta (máx.)733msTempo de resposta (total)733ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 8Não seguiu as instruções: 3Tempo de resposta (médio)2.27sTempo de resposta (máx.)14.63sTempo de resposta (total)43.20s…
Programação
: 7.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.29sTempo de resposta (máx.)3.06sTempo de resposta (total)4.58s
Combinado
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.28sTempo de resposta (máx.)3.28sTempo de resposta (total)3.28s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.47sTempo de resposta (total)2.21s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)6.48sTempo de resposta (máx.)14.63sTempo de resposta (total)19.43s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)821msTempo de resposta (máx.)821msTempo de resposta (total)821ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.07sTempo de resposta (máx.)1.07sTempo de resposta (total)1.07s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.89sTempo de resposta (máx.)1.89sTempo de resposta (total)1.89s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.58sTempo de resposta (máx.)2.58sTempo de resposta (total)2.58s