Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)3.81sTempo de resposta (máx.)6.85sTempo de resposta (total)15.23s
Programação
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.17sTempo de resposta (máx.)15.17sTempo de resposta (total)15.17s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.49sTempo de resposta (máx.)14.02sTempo de resposta (total)16.98s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.33sTempo de resposta (máx.)2.94sTempo de resposta (total)6.99s
Inteligência geral
: 6.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.71sTempo de resposta (máx.)2.71sTempo de resposta (total)2.71s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.82sTempo de resposta (máx.)2.92sTempo de resposta (total)5.65s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.02sTempo de resposta (máx.)6.02sTempo de resposta (total)6.02s
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)501msTempo de resposta (máx.)839msTempo de resposta (total)2.01s
Programação
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.22sTempo de resposta (máx.)1.22sTempo de resposta (total)1.22s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)6.04sTempo de resposta (máx.)6.04sTempo de resposta (total)6.04s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)522msTempo de resposta (máx.)537msTempo de resposta (total)1.04s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)659msTempo de resposta (máx.)659msTempo de resposta (total)659ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)445msTempo de resposta (máx.)505msTempo de resposta (total)889ms
Resolução de quebra-cabeças
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)473msTempo de resposta (máx.)502msTempo de resposta (total)1.42s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.63sTempo de resposta (máx.)4.63sTempo de resposta (total)4.63s
Truques anti-IA
: 6.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)2.68sTempo de resposta (máx.)3.09sTempo de resposta (total)8.04s
Programação
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)14.36sTempo de resposta (máx.)14.36sTempo de resposta (total)14.36s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)15.92sTempo de resposta (máx.)15.92sTempo de resposta (total)15.92s
Análise e extração de dados
: 7.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)9.34sTempo de resposta (máx.)16.71sTempo de resposta (total)18.68s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.68sTempo de resposta (máx.)2.03sTempo de resposta (total)3.36s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)3.39sTempo de resposta (máx.)3.39sTempo de resposta (total)3.39s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Programação
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)9.57sTempo de resposta (máx.)9.57sTempo de resposta (total)9.57s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)7.12sTempo de resposta (máx.)7.12sTempo de resposta (total)7.12s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)34.98sTempo de resposta (máx.)68.97sTempo de resposta (total)104.94s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)10.79sTempo de resposta (máx.)10.79sTempo de resposta (total)10.79s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.06sTempo de resposta (máx.)5.85sTempo de resposta (total)10.12s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)47.29sTempo de resposta (máx.)47.29sTempo de resposta (total)47.29s
Truques anti-IA
: 5.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)5.51sTempo de resposta (máx.)6.59sTempo de resposta (total)11.02s
Programação
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.35sTempo de resposta (máx.)5.57sTempo de resposta (total)6.70s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)3.22sTempo de resposta (máx.)3.22sTempo de resposta (total)3.22s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.82sTempo de resposta (máx.)4.82sTempo de resposta (total)4.82s
Específico do domínio
: 7.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)744msTempo de resposta (máx.)744msTempo de resposta (total)744ms
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.59sTempo de resposta (máx.)1.59sTempo de resposta (total)1.59s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)888msTempo de resposta (máx.)888msTempo de resposta (total)888ms
Chamada de ferramentas
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.05sTempo de resposta (máx.)7.05sTempo de resposta (total)7.05s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)692msTempo de resposta (máx.)692msTempo de resposta (total)692ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 10Não seguiu as instruções: 4Tempo de resposta (médio)1.84sTempo de resposta (máx.)8.32sTempo de resposta (total)36.79s…
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)3.54sTempo de resposta (máx.)3.54sTempo de resposta (total)3.54s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.32sTempo de resposta (máx.)1.42sTempo de resposta (total)2.64s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)877msTempo de resposta (máx.)904msTempo de resposta (total)2.63s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.58sTempo de resposta (máx.)2.58sTempo de resposta (total)2.58s
Seguimento de instruções
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.03sTempo de resposta (máx.)1.10sTempo de resposta (total)2.06s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.30sTempo de resposta (máx.)3.30sTempo de resposta (total)3.30s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.89sTempo de resposta (máx.)1.89sTempo de resposta (total)1.89s
Combinado
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)115.89sTempo de resposta (máx.)115.89sTempo de resposta (total)115.89s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)9.42sTempo de resposta (máx.)16.20sTempo de resposta (total)18.84s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Erro de API: 1Tempo de resposta (médio)4.17sTempo de resposta (máx.)9.09sTempo de resposta (total)12.51s
Inteligência geral
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)9.32sTempo de resposta (máx.)9.32sTempo de resposta (total)9.32s
Seguimento de instruções
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.52sTempo de resposta (máx.)1.99sTempo de resposta (total)3.04s
Resolução de quebra-cabeças
: 7.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)6.91sTempo de resposta (máx.)10.09sTempo de resposta (total)20.74s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)11.85sTempo de resposta (máx.)11.85sTempo de resposta (total)11.85s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)17.23sTempo de resposta (máx.)17.23sTempo de resposta (total)17.23s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 2Tempo de resposta (médio)3.38sTempo de resposta (máx.)46.00sTempo de resposta (total)67.55s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.59sTempo de resposta (máx.)3.60sTempo de resposta (total)6.38s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.14sTempo de resposta (máx.)3.44sTempo de resposta (total)4.29s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)46.00sTempo de resposta (máx.)46.00sTempo de resposta (total)46.00s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.01sTempo de resposta (máx.)1.06sTempo de resposta (total)2.02s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)465msTempo de resposta (máx.)492msTempo de resposta (total)1.39s
Inteligência geral
: 5.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.12sTempo de resposta (máx.)1.12sTempo de resposta (total)1.12s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)513msTempo de resposta (máx.)570msTempo de resposta (total)1.03s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.04sTempo de resposta (máx.)2.04sTempo de resposta (total)2.04s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)295msTempo de resposta (máx.)295msTempo de resposta (total)295ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 2Tempo de resposta (médio)2.86sTempo de resposta (máx.)8.21sTempo de resposta (total)57.24s…
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.84sTempo de resposta (máx.)4.15sTempo de resposta (total)11.35s
Programação
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.58sTempo de resposta (máx.)3.93sTempo de resposta (total)5.16s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.89sTempo de resposta (máx.)4.89sTempo de resposta (total)4.89s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.47sTempo de resposta (máx.)2.48sTempo de resposta (total)4.95s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.97sTempo de resposta (máx.)2.65sTempo de resposta (total)5.92s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.18sTempo de resposta (máx.)2.18sTempo de resposta (total)2.18s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.13sTempo de resposta (máx.)2.53sTempo de resposta (total)4.27s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)8.21sTempo de resposta (máx.)8.21sTempo de resposta (total)8.21s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.37sTempo de resposta (máx.)2.37sTempo de resposta (total)2.37s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 14Tempo de resposta (médio)14.06sTempo de resposta (máx.)42.13sTempo de resposta (total)182.72s…
Truques anti-IA
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)6.24sTempo de resposta (máx.)11.38sTempo de resposta (total)12.48s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)35.97sTempo de resposta (máx.)38.78sTempo de resposta (total)71.93s
Combinado
: 2.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)19.16sTempo de resposta (máx.)19.16sTempo de resposta (total)19.16s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)42.13sTempo de resposta (máx.)42.13sTempo de resposta (total)42.13s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)4.38sTempo de resposta (máx.)4.38sTempo de resposta (total)4.38s
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)4.00sTempo de resposta (máx.)4.00sTempo de resposta (total)4.00s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.67sTempo de resposta (máx.)2.67sTempo de resposta (total)2.67s
Resolução de quebra-cabeças
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)4.04sTempo de resposta (máx.)7.81sTempo de resposta (total)8.08s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)13.99sTempo de resposta (máx.)13.99sTempo de resposta (total)13.99s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.90sTempo de resposta (máx.)3.90sTempo de resposta (total)3.90s
Truques anti-IA
: 6.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.19sTempo de resposta (máx.)2.04sTempo de resposta (total)4.75s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)1.30sTempo de resposta (máx.)1.30sTempo de resposta (total)1.30s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.70sTempo de resposta (máx.)3.70sTempo de resposta (total)3.70s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)979msTempo de resposta (máx.)1.02sTempo de resposta (total)1.96s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)925msTempo de resposta (máx.)1.16sTempo de resposta (total)2.77s
Inteligência geral
: 4.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)920msTempo de resposta (máx.)920msTempo de resposta (total)920ms
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)987msTempo de resposta (máx.)1.13sTempo de resposta (total)1.97s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)2.83sTempo de resposta (máx.)2.83sTempo de resposta (total)2.83s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Programação
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)11.21sTempo de resposta (máx.)11.21sTempo de resposta (total)11.21s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)35.34sTempo de resposta (máx.)35.34sTempo de resposta (total)35.34s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.48sTempo de resposta (máx.)12.71sTempo de resposta (total)16.96s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)4.95sTempo de resposta (máx.)7.65sTempo de resposta (total)14.84s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.45sTempo de resposta (máx.)1.45sTempo de resposta (total)1.45s
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)5.52sTempo de resposta (máx.)8.19sTempo de resposta (total)11.04s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)18.80sTempo de resposta (máx.)18.80sTempo de resposta (total)18.80s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.06sTempo de resposta (máx.)1.06sTempo de resposta (total)1.06s
Programação
: 2.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.96sTempo de resposta (máx.)1.96sTempo de resposta (total)1.96s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.01sTempo de resposta (máx.)2.01sTempo de resposta (total)2.01s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)646msTempo de resposta (máx.)658msTempo de resposta (total)1.29s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)371msTempo de resposta (máx.)419msTempo de resposta (total)1.11s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)439msTempo de resposta (máx.)448msTempo de resposta (total)878ms
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)1.93sTempo de resposta (máx.)1.93sTempo de resposta (total)1.93s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Programação
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)125.80sTempo de resposta (máx.)125.80sTempo de resposta (total)125.80s
Combinado
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)60.39sTempo de resposta (máx.)60.39sTempo de resposta (total)60.39s
Análise e extração de dados
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)7.48sTempo de resposta (máx.)7.48sTempo de resposta (total)7.48s
Inteligência geral
: 3.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)6.63sTempo de resposta (máx.)6.63sTempo de resposta (total)6.63s
Seguimento de instruções
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)621msTempo de resposta (máx.)621msTempo de resposta (total)621ms
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)15.35sTempo de resposta (máx.)15.35sTempo de resposta (total)15.35s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)80.79sTempo de resposta (máx.)80.79sTempo de resposta (total)80.79s
Programação
: 6.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem resposta: 1Tempo de resposta (médio)54.73sTempo de resposta (máx.)91.27sTempo de resposta (total)109.46s
Combinado
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)41.03sTempo de resposta (máx.)41.03sTempo de resposta (total)41.03s
Análise e extração de dados
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)21.95sTempo de resposta (máx.)24.88sTempo de resposta (total)43.89s
Inteligência geral
: 3.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)38.70sTempo de resposta (máx.)38.70sTempo de resposta (total)38.70s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)12.05sTempo de resposta (máx.)12.05sTempo de resposta (total)12.05s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)22.77sTempo de resposta (máx.)22.77sTempo de resposta (total)22.77s
Truques anti-IA
: 5.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)2.67sTempo de resposta (máx.)5.03sTempo de resposta (total)10.66s
Programação
: 5.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)44.82sTempo de resposta (máx.)59.15sTempo de resposta (total)89.64s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)25.25sTempo de resposta (máx.)25.25sTempo de resposta (total)25.25s
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)1.23sTempo de resposta (máx.)1.96sTempo de resposta (total)2.46s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)6.11sTempo de resposta (máx.)13.72sTempo de resposta (total)18.34s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.05sTempo de resposta (máx.)2.05sTempo de resposta (total)2.05s
Seguimento de instruções
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.38sTempo de resposta (máx.)1.61sTempo de resposta (total)2.75s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.50sTempo de resposta (máx.)3.50sTempo de resposta (total)3.50s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)5.92sTempo de resposta (máx.)5.92sTempo de resposta (total)5.92s
Programação
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)1.39sTempo de resposta (máx.)1.39sTempo de resposta (total)1.39s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.81sTempo de resposta (máx.)3.81sTempo de resposta (total)3.81s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.04sTempo de resposta (máx.)1.05sTempo de resposta (total)2.08s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)927msTempo de resposta (máx.)1.17sTempo de resposta (total)2.78s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)854msTempo de resposta (máx.)854msTempo de resposta (total)854ms
Seguimento de instruções
: 9.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.03sTempo de resposta (máx.)1.17sTempo de resposta (total)2.07s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)2.79sTempo de resposta (máx.)2.79sTempo de resposta (total)2.79s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Truques anti-IA
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)20.18sTempo de resposta (máx.)26.54sTempo de resposta (total)80.73s
Programação
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)24.47sTempo de resposta (máx.)24.90sTempo de resposta (total)48.94s
Combinado
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)111.96sTempo de resposta (máx.)111.96sTempo de resposta (total)111.96s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)23.79sTempo de resposta (máx.)23.85sTempo de resposta (total)47.57s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)19.73sTempo de resposta (máx.)27.66sTempo de resposta (total)59.18s
Inteligência geral
: 4.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)23.74sTempo de resposta (máx.)23.74sTempo de resposta (total)23.74s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)17.54sTempo de resposta (máx.)18.51sTempo de resposta (total)35.08s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)77.93sTempo de resposta (máx.)77.93sTempo de resposta (total)77.93s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.07sTempo de resposta (máx.)3.07sTempo de resposta (total)3.07s
Programação
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.01sTempo de resposta (máx.)3.14sTempo de resposta (total)4.03s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)45.14sTempo de resposta (máx.)45.14sTempo de resposta (total)45.14s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.32sTempo de resposta (máx.)1.32sTempo de resposta (total)1.32s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)962msTempo de resposta (máx.)962msTempo de resposta (total)962ms
Inteligência geral
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.34sTempo de resposta (máx.)1.34sTempo de resposta (total)1.34s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.78sTempo de resposta (máx.)14.65sTempo de resposta (total)15.56s
Resolução de quebra-cabeças
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)24.34sTempo de resposta (máx.)42.58sTempo de resposta (total)48.69s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.47sTempo de resposta (máx.)2.47sTempo de resposta (total)2.47s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)601msTempo de resposta (máx.)601msTempo de resposta (total)601ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 13Não seguiu as instruções: 2Tempo de resposta (médio)5.47sTempo de resposta (máx.)16.45sTempo de resposta (total)109.43s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)4.46sTempo de resposta (máx.)9.94sTempo de resposta (total)17.83s
Programação
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)3.02sTempo de resposta (máx.)3.05sTempo de resposta (total)6.04s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)16.45sTempo de resposta (máx.)16.45sTempo de resposta (total)16.45s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.92sTempo de resposta (máx.)13.23sTempo de resposta (total)15.84s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)6.23sTempo de resposta (máx.)14.38sTempo de resposta (total)18.70s
Inteligência geral
: 4.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)950msTempo de resposta (máx.)950msTempo de resposta (total)950ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)804msTempo de resposta (máx.)921msTempo de resposta (total)1.61s
Chamada de ferramentas
: 4.7 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)16.00sTempo de resposta (máx.)16.00sTempo de resposta (total)16.00s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.94sTempo de resposta (máx.)8.94sTempo de resposta (total)8.94s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 14Não seguiu as instruções: 1Tempo de resposta (médio)629msTempo de resposta (máx.)1.72sTempo de resposta (total)12.59s…
Truques anti-IA
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)395msTempo de resposta (máx.)769msTempo de resposta (total)1.58s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.03sTempo de resposta (máx.)1.28sTempo de resposta (total)2.07s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.72sTempo de resposta (máx.)1.72sTempo de resposta (total)1.72s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)822msTempo de resposta (máx.)1.08sTempo de resposta (total)1.64s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)367msTempo de resposta (máx.)388msTempo de resposta (total)1.10s
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)729msTempo de resposta (máx.)729msTempo de resposta (total)729ms
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)380msTempo de resposta (máx.)380msTempo de resposta (total)759ms
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.40sTempo de resposta (máx.)1.40sTempo de resposta (total)1.40s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)397msTempo de resposta (máx.)397msTempo de resposta (total)397ms
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.19sTempo de resposta (máx.)6.85sTempo de resposta (total)8.74s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.74sTempo de resposta (máx.)5.52sTempo de resposta (total)7.47s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.36sTempo de resposta (máx.)2.36sTempo de resposta (total)2.36s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Formatação extra: 1Tempo de resposta (médio)1.01sTempo de resposta (máx.)1.18sTempo de resposta (total)2.03s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)756msTempo de resposta (máx.)877msTempo de resposta (total)2.27s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)6.86sTempo de resposta (máx.)6.86sTempo de resposta (total)6.86s
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)751msTempo de resposta (máx.)821msTempo de resposta (total)1.50s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.43sTempo de resposta (máx.)2.43sTempo de resposta (total)2.43s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.89sTempo de resposta (máx.)3.89sTempo de resposta (total)3.89s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 12Não seguiu as instruções: 3Tempo de resposta (médio)1.15sTempo de resposta (máx.)2.52sTempo de resposta (total)23.09s…
Truques anti-IA
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)929msTempo de resposta (máx.)1.55sTempo de resposta (total)3.72s
Programação
: 6.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.01sTempo de resposta (máx.)1.19sTempo de resposta (total)2.02s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.52sTempo de resposta (máx.)2.52sTempo de resposta (total)2.52s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.30sTempo de resposta (máx.)1.58sTempo de resposta (total)2.61s
Específico do domínio
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)937msTempo de resposta (máx.)1.25sTempo de resposta (total)2.81s
Inteligência geral
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.82sTempo de resposta (máx.)1.82sTempo de resposta (total)1.82s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)728msTempo de resposta (máx.)731msTempo de resposta (total)1.46s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)2.32sTempo de resposta (máx.)2.32sTempo de resposta (total)2.32s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.33sTempo de resposta (máx.)1.33sTempo de resposta (total)1.33s
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 14Não seguiu as instruções: 1Tempo de resposta (médio)1.85sTempo de resposta (máx.)7.58sTempo de resposta (total)24.00s…
Truques anti-IA
: 4.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)1.34sTempo de resposta (máx.)1.83sTempo de resposta (total)2.67s
Programação
: 3.2 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)2.05sTempo de resposta (máx.)2.55sTempo de resposta (total)4.10s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.58sTempo de resposta (máx.)7.58sTempo de resposta (total)7.58s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.27sTempo de resposta (máx.)1.27sTempo de resposta (total)1.27s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)637msTempo de resposta (máx.)637msTempo de resposta (total)637ms
Inteligência geral
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)909msTempo de resposta (máx.)909msTempo de resposta (total)909ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.11sTempo de resposta (total)1.11s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.51sTempo de resposta (máx.)2.51sTempo de resposta (total)2.51s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)794msTempo de resposta (máx.)794msTempo de resposta (total)794ms
Truques anti-IA
: 3.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Erro de API: 1Tempo de resposta (médio)705msTempo de resposta (máx.)975msTempo de resposta (total)2.12s
Programação
: 7.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.93sTempo de resposta (máx.)2.93sTempo de resposta (total)2.93s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)4.32sTempo de resposta (máx.)4.32sTempo de resposta (total)4.32s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.37sTempo de resposta (máx.)5.76sTempo de resposta (total)6.73s
Específico do domínio
: 3.6 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)5.50sTempo de resposta (máx.)15.42sTempo de resposta (total)16.50s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)683msTempo de resposta (máx.)691msTempo de resposta (total)1.37s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)7.54sTempo de resposta (máx.)7.54sTempo de resposta (total)7.54s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Truques anti-IA
: 6.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)1.20sTempo de resposta (máx.)1.48sTempo de resposta (total)3.59s
Programação
: 3.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)38.09sTempo de resposta (máx.)38.09sTempo de resposta (total)38.09s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Análise e extração de dados
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.72sTempo de resposta (máx.)3.88sTempo de resposta (total)5.43s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Sem resposta: 1Tempo de resposta (médio)56.67sTempo de resposta (máx.)147.45sTempo de resposta (total)170.02s
Inteligência geral
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Seguimento de instruções
: 7.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.37sTempo de resposta (máx.)1.56sTempo de resposta (total)2.74s
Chamada de ferramentas
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Tempo de resposta (médio)0msTempo de resposta (máx.)0msTempo de resposta (total)0ms
Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 14Não seguiu as instruções: 2Tempo de resposta (médio)1.33sTempo de resposta (máx.)3.84sTempo de resposta (total)26.54s…
Truques anti-IA
: 3.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.18sTempo de resposta (máx.)1.81sTempo de resposta (total)4.70s
Programação
: 5.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)1.09sTempo de resposta (máx.)1.43sTempo de resposta (total)2.18s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)3.84sTempo de resposta (máx.)3.84sTempo de resposta (total)3.84s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)1.11sTempo de resposta (máx.)1.25sTempo de resposta (total)2.23s
Específico do domínio
: 2.9 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)926msTempo de resposta (máx.)959msTempo de resposta (total)2.78s
Inteligência geral
: 3.8 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.31sTempo de resposta (máx.)1.31sTempo de resposta (total)1.31s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)784msTempo de resposta (máx.)859msTempo de resposta (total)1.57s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.40sTempo de resposta (máx.)3.40sTempo de resposta (total)3.40s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)773msTempo de resposta (máx.)773msTempo de resposta (total)773ms
Programação
: 4.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Tempo esgotado: 1Resposta incorreta: 1Tempo de resposta (médio)1.17sTempo de resposta (máx.)1.69sTempo de resposta (total)2.34s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)4.28sTempo de resposta (máx.)4.28sTempo de resposta (total)4.28s
Análise e extração de dados
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)81.80sTempo de resposta (máx.)81.80sTempo de resposta (total)81.80s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)638msTempo de resposta (máx.)638msTempo de resposta (total)638ms
Inteligência geral
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)1.39sTempo de resposta (máx.)1.39sTempo de resposta (total)1.39s
Seguimento de instruções
: 6.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)7.49sTempo de resposta (máx.)13.67sTempo de resposta (total)14.99s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)2.64sTempo de resposta (máx.)2.64sTempo de resposta (total)2.64s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)399msTempo de resposta (máx.)399msTempo de resposta (total)399ms
Truques anti-IA
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)2.07sTempo de resposta (máx.)4.40sTempo de resposta (total)8.30s
Programação
: 4.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Erro de API: 1Resposta incorreta: 1Tempo de resposta (médio)14.34sTempo de resposta (máx.)14.34sTempo de resposta (total)14.34s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)8.91sTempo de resposta (máx.)8.91sTempo de resposta (total)8.91s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)3.26sTempo de resposta (máx.)4.66sTempo de resposta (total)6.52s
Específico do domínio
: 5.3 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)877msTempo de resposta (máx.)894msTempo de resposta (total)2.63s
Inteligência geral
: 4.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)873msTempo de resposta (máx.)873msTempo de resposta (total)873ms
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)6.67sTempo de resposta (máx.)6.67sTempo de resposta (total)6.67s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)777msTempo de resposta (máx.)777msTempo de resposta (total)777ms
Truques anti-IA
: 3.1 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 4Tempo de resposta (médio)1.71sTempo de resposta (máx.)3.79sTempo de resposta (total)6.84s
Programação
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 2Tempo de resposta (médio)5.39sTempo de resposta (máx.)5.69sTempo de resposta (total)10.78s
Combinado
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Chamada de ferramenta inválida: 1Tempo de resposta (médio)5.91sTempo de resposta (máx.)5.91sTempo de resposta (total)5.91s
Análise e extração de dados
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)847msTempo de resposta (máx.)1.09sTempo de resposta (total)1.69s
Específico do domínio
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 3Tempo de resposta (médio)464msTempo de resposta (máx.)622msTempo de resposta (total)1.39s
Inteligência geral
: 4.4 Um teste é totalmente aprovado apenas quando todas as execuções passam.Não seguiu as instruções: 1Tempo de resposta (médio)552msTempo de resposta (máx.)552msTempo de resposta (total)552ms
Seguimento de instruções
: 6.5 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)514msTempo de resposta (máx.)582msTempo de resposta (total)1.03s
Chamada de ferramentas
: 10.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Sem respostas com falha.Tempo de resposta (médio)1.27sTempo de resposta (máx.)1.27sTempo de resposta (total)1.27s
Conhecimentos gerais
: 3.0 Um teste é totalmente aprovado apenas quando todas as execuções passam.Resposta incorreta: 1Tempo de resposta (médio)2.32sTempo de resposta (máx.)2.32sTempo de resposta (total)2.32s