Tests totaux: 18Tests incorrects: 9Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 51.9%Tests instables: 1…Jetons de sortie: 1,611Jetons de raisonnement: 0Temps de réponse : moy. 23.34s · total 420.04s · max 109.46s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)33.40sTemps de réponse (max)33.40sTemps de réponse (total)33.40s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.55sTemps de réponse (max)34.55sTemps de réponse (total)34.55s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)54.04sTemps de réponse (max)105.46sTemps de réponse (total)108.08s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)3.08sTemps de réponse (max)6.59sTemps de réponse (total)9.24s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.06sTemps de réponse (max)6.06sTemps de réponse (total)6.06s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.47sTemps de réponse (max)13.43sTemps de réponse (total)18.95s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.47sTemps de réponse (max)6.47sTemps de réponse (total)6.47s
Tests totaux: 18Tests incorrects: 9Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 64.8%Tests instables: 6…Jetons de sortie: 2,010Jetons de raisonnement: 91,298Temps de réponse : moy. 23.88s · total 262.66s · max 121.79s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.81sTemps de réponse (max)5.65sTemps de réponse (total)7.62s
Programmation
: 2.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)23.58sTemps de réponse (max)23.58sTemps de réponse (total)23.58s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)37.64sTemps de réponse (max)37.64sTemps de réponse (total)37.64s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.63sTemps de réponse (max)6.63sTemps de réponse (total)6.63s
Spécifique au domaine
: 5.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)121.79sTemps de réponse (max)121.79sTemps de réponse (total)121.79s
Intelligence générale
: 4.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)16.25sTemps de réponse (max)16.25sTemps de réponse (total)16.25s
Suivi des instructions
: 6.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.30sTemps de réponse (max)5.30sTemps de réponse (total)5.30s
Appel d'outils
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)27.71sTemps de réponse (max)27.71sTemps de réponse (total)27.71s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9Temps de réponse (moy.)4.23sTemps de réponse (max)11.07sTemps de réponse (total)46.51s…
Tests totaux: 18Tests incorrects: 9Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 51.9%Tests instables: 1…Jetons de sortie: 1,959Jetons de raisonnement: 0Temps de réponse : moy. 4.23s · total 46.51s · max 11.07s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.37sTemps de réponse (max)3.39sTemps de réponse (total)4.75s
Programmation
: 5.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.84sTemps de réponse (max)8.84sTemps de réponse (total)8.84s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.98sTemps de réponse (max)4.98sTemps de réponse (total)4.98s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.78sTemps de réponse (max)5.78sTemps de réponse (total)5.78s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.24sTemps de réponse (max)2.24sTemps de réponse (total)2.24s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.27sTemps de réponse (max)3.27sTemps de réponse (total)3.27s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.48sTemps de réponse (max)1.48sTemps de réponse (total)1.48s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.05sTemps de réponse (max)2.08sTemps de réponse (total)4.10s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.07sTemps de réponse (max)11.07sTemps de réponse (total)11.07s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 6N'a pas suivi les instructions: 4Temps de réponse (moy.)2.21sTemps de réponse (max)14.63sTemps de réponse (total)37.51s…
Tests totaux: 18Tests incorrects: 10Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 53.7%Tests instables: 3…Jetons de sortie: 3,972Jetons de raisonnement: 48,333Temps de réponse : moy. 2.21s · total 37.51s · max 14.63s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.53sTemps de réponse (max)1.53sTemps de réponse (total)1.53s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.28sTemps de réponse (max)3.28sTemps de réponse (total)3.28s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.11sTemps de réponse (max)1.47sTemps de réponse (total)2.21s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)6.48sTemps de réponse (max)14.63sTemps de réponse (total)19.43s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)821msTemps de réponse (max)821msTemps de réponse (total)821ms
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.07sTemps de réponse (max)1.07sTemps de réponse (total)1.07s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.89sTemps de réponse (max)1.89sTemps de réponse (total)1.89s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 8N'a pas suivi les instructions: 2Temps de réponse (moy.)1.99sTemps de réponse (max)6.81sTemps de réponse (total)35.81s…
Tests totaux: 18Tests incorrects: 10Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 44.4%Tests instables: 0…Jetons de sortie: 868Jetons de raisonnement: 0Temps de réponse : moy. 1.99s · total 35.81s · max 6.81s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.10sTemps de réponse (max)2.08sTemps de réponse (total)4.39s
Programmation
: 6.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.72sTemps de réponse (max)1.72sTemps de réponse (total)1.72s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.47sTemps de réponse (max)2.47sTemps de réponse (total)2.47s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.69sTemps de réponse (max)2.46sTemps de réponse (total)3.38s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.14sTemps de réponse (max)1.63sTemps de réponse (total)3.41s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.19sTemps de réponse (max)1.19sTemps de réponse (total)1.19s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.18sTemps de réponse (max)6.81sTemps de réponse (total)8.36s
Résolution d'énigmes
: 8.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.71sTemps de réponse (max)5.96sTemps de réponse (total)8.14s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.76sTemps de réponse (max)2.76sTemps de réponse (total)2.76s
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 57.4%Tests instables: 6…Jetons de sortie: 299,034Jetons de raisonnement: 309,670Temps de réponse : moy. 9.80s · total 156.75s · max 35.28s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)27.11sTemps de réponse (max)27.11sTemps de réponse (total)27.11s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.54sTemps de réponse (max)7.51sTemps de réponse (total)11.08s
Intelligence générale
: 5.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.40sTemps de réponse (max)6.40sTemps de réponse (total)6.40s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.63sTemps de réponse (max)5.46sTemps de réponse (total)9.26s
Résolution d'énigmes
: 7.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)5.01sTemps de réponse (max)5.49sTemps de réponse (total)15.03s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 59.3%Tests instables: 8…Jetons de sortie: 4,980Jetons de raisonnement: 156,288Temps de réponse : moy. 44.13s · total 485.47s · max 204.02s
Astuces anti-IA
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)25.50sTemps de réponse (max)37.73sTemps de réponse (total)51.00s
Programmation
: 6.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)40.73sTemps de réponse (max)40.73sTemps de réponse (total)40.73s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)65.96sTemps de réponse (max)65.96sTemps de réponse (total)65.96s
Analyse et extraction des données
: 3.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)21.42sTemps de réponse (max)21.42sTemps de réponse (total)21.42s
Spécifique au domaine
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)204.02sTemps de réponse (max)204.02sTemps de réponse (total)204.02s
Intelligence générale
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)17.51sTemps de réponse (max)17.51sTemps de réponse (total)17.51s
Suivi des instructions
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)11.90sTemps de réponse (max)11.90sTemps de réponse (total)11.90s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)33.30sTemps de réponse (max)33.30sTemps de réponse (total)33.30s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 8N'a pas suivi les instructions: 2Temps de réponse (moy.)3.10sTemps de réponse (max)6.51sTemps de réponse (total)55.87s…
Tests totaux: 18Tests incorrects: 10Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 44.4%Tests instables: 0…Jetons de sortie: 1,724Jetons de raisonnement: 0Temps de réponse : moy. 3.10s · total 55.87s · max 6.51s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)3.13sTemps de réponse (max)5.90sTemps de réponse (total)12.50s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.30sTemps de réponse (max)5.30sTemps de réponse (total)5.30s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.51sTemps de réponse (max)6.51sTemps de réponse (total)6.51s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.81sTemps de réponse (max)5.69sTemps de réponse (total)7.62s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.09sTemps de réponse (max)2.39sTemps de réponse (total)6.26s
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.22sTemps de réponse (max)2.22sTemps de réponse (total)2.22s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.97sTemps de réponse (max)2.43sTemps de réponse (total)3.93s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.86sTemps de réponse (max)4.86sTemps de réponse (total)4.86s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 1Temps de réponse (moy.)3.25sTemps de réponse (max)13.73sTemps de réponse (total)58.44s…
Tests totaux: 18Tests incorrects: 10Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 46.3%Tests instables: 1…Jetons de sortie: 4,266Jetons de raisonnement: 0Temps de réponse : moy. 3.25s · total 58.44s · max 13.73s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.32sTemps de réponse (max)3.89sTemps de réponse (total)5.30s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.29sTemps de réponse (max)1.29sTemps de réponse (total)1.29s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.22sTemps de réponse (max)6.22sTemps de réponse (total)6.22s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.57sTemps de réponse (max)1.83sTemps de réponse (total)3.14s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)905msTemps de réponse (max)1.10sTemps de réponse (total)2.71s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)803msTemps de réponse (max)803msTemps de réponse (total)803ms
Suivi des instructions
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.81sTemps de réponse (max)13.73sTemps de réponse (total)17.61s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.67sTemps de réponse (max)3.67sTemps de réponse (total)3.67s
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 48.2%Tests instables: 3…Jetons de sortie: 1,783Jetons de raisonnement: 0Temps de réponse : moy. 6.59s · total 118.61s · max 57.10s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.28sTemps de réponse (max)2.09sTemps de réponse (total)5.13s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)7.07sTemps de réponse (max)7.07sTemps de réponse (total)7.07s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)30.53sTemps de réponse (max)30.53sTemps de réponse (total)30.53s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.70sTemps de réponse (max)2.21sTemps de réponse (total)3.41s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.49sTemps de réponse (max)4.23sTemps de réponse (total)7.48s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)57.10sTemps de réponse (max)57.10sTemps de réponse (total)57.10s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10Temps de réponse (moy.)2.53sTemps de réponse (max)6.70sTemps de réponse (total)45.46s…
Tests totaux: 18Tests incorrects: 10Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 55.6%Tests instables: 5…Jetons de sortie: 3,129Jetons de raisonnement: 0Temps de réponse : moy. 2.53s · total 45.46s · max 6.70s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)2.43sTemps de réponse (max)6.70sTemps de réponse (total)9.73s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.61sTemps de réponse (max)4.61sTemps de réponse (total)4.61s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.59sTemps de réponse (max)6.59sTemps de réponse (total)6.59s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.82sTemps de réponse (max)1.97sTemps de réponse (total)3.63s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.33sTemps de réponse (max)1.53sTemps de réponse (total)4.00s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.45sTemps de réponse (max)3.45sTemps de réponse (total)3.45s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.06sTemps de réponse (max)1.09sTemps de réponse (total)2.12s
Résolution d'énigmes
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.46sTemps de réponse (max)4.23sTemps de réponse (total)7.37s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.94sTemps de réponse (max)3.94sTemps de réponse (total)3.94s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 1Temps de réponse (moy.)903msTemps de réponse (max)4.39sTemps de réponse (total)16.26s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 44.4%Tests instables: 2…Jetons de sortie: 1,726Jetons de raisonnement: 0Temps de réponse : moy. 903ms · total 16.26s · max 4.39s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)582msTemps de réponse (max)844msTemps de réponse (total)2.33s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.16sTemps de réponse (max)1.16sTemps de réponse (total)1.16s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.39sTemps de réponse (max)4.39sTemps de réponse (total)4.39s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)652msTemps de réponse (max)660msTemps de réponse (total)1.30s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)495msTemps de réponse (max)642msTemps de réponse (total)1.49s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)615msTemps de réponse (max)615msTemps de réponse (total)615ms
Suivi des instructions
: 8.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)672msTemps de réponse (max)785msTemps de réponse (total)1.34s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.91sTemps de réponse (max)1.91sTemps de réponse (total)1.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)3.82sTemps de réponse (max)47.43sTemps de réponse (total)68.74s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 50.0%Tests instables: 3…Jetons de sortie: 4,300Jetons de raisonnement: 0Temps de réponse : moy. 3.82s · total 68.74s · max 47.43s
Astuces anti-IA
: 3.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.43sTemps de réponse (max)4.39sTemps de réponse (total)5.71s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.67sTemps de réponse (max)2.67sTemps de réponse (total)2.67s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)47.43sTemps de réponse (max)47.43sTemps de réponse (total)47.43s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.16sTemps de réponse (max)1.42sTemps de réponse (total)2.33s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)485msTemps de réponse (max)549msTemps de réponse (total)1.45s
Intelligence générale
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.19sTemps de réponse (max)1.19sTemps de réponse (total)1.19s
Suivi des instructions
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)809msTemps de réponse (max)983msTemps de réponse (total)1.62s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.30sTemps de réponse (max)2.30sTemps de réponse (total)2.30s
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 46.3%Tests instables: 3…Jetons de sortie: 8,378Jetons de raisonnement: 0Temps de réponse : moy. 12.07s · total 217.28s · max 115.89s
Programmation
: 2.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.63sTemps de réponse (max)7.63sTemps de réponse (total)7.63s
Combiné
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)115.89sTemps de réponse (max)115.89sTemps de réponse (total)115.89s
Analyse et extraction des données
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.42sTemps de réponse (max)16.20sTemps de réponse (total)18.84s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.52sTemps de réponse (max)1.77sTemps de réponse (total)4.55s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.52sTemps de réponse (max)1.99sTemps de réponse (total)3.04s
Résolution d'énigmes
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.37sTemps de réponse (max)10.78sTemps de réponse (total)22.10s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.85sTemps de réponse (max)11.85sTemps de réponse (total)11.85s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)2.39sTemps de réponse (max)6.58sTemps de réponse (total)43.06s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 48.2%Tests instables: 3…Jetons de sortie: 2,320Jetons de raisonnement: 0Temps de réponse : moy. 2.39s · total 43.06s · max 6.58s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.80sTemps de réponse (max)2.62sTemps de réponse (total)7.19s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.82sTemps de réponse (max)3.82sTemps de réponse (total)3.82s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.58sTemps de réponse (max)6.58sTemps de réponse (total)6.58s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.39sTemps de réponse (max)1.42sTemps de réponse (total)2.78s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.78sTemps de réponse (max)2.49sTemps de réponse (total)5.34s
Intelligence générale
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.44sTemps de réponse (max)2.44sTemps de réponse (total)2.44s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.51sTemps de réponse (max)2.95sTemps de réponse (total)5.02s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.39sTemps de réponse (max)4.39sTemps de réponse (total)4.39s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 1Temps de réponse (moy.)1.51sTemps de réponse (max)2.95sTemps de réponse (total)27.21s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 42.6%Tests instables: 2…Jetons de sortie: 2,317Jetons de raisonnement: 0Temps de réponse : moy. 1.51s · total 27.21s · max 2.95s
Astuces anti-IA
: 3.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.21sTemps de réponse (max)2.58sTemps de réponse (total)4.85s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.95sTemps de réponse (max)2.95sTemps de réponse (total)2.95s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.89sTemps de réponse (max)2.89sTemps de réponse (total)2.89s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.04sTemps de réponse (max)1.06sTemps de réponse (total)2.08s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.07sTemps de réponse (max)1.54sTemps de réponse (total)3.22s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.78sTemps de réponse (max)1.78sTemps de réponse (total)1.78s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.07sTemps de réponse (max)1.17sTemps de réponse (total)2.15s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.75sTemps de réponse (max)2.75sTemps de réponse (total)2.75s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)1.74sTemps de réponse (max)9.39sTemps de réponse (total)31.32s…
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 38.9%Tests instables: 2…Jetons de sortie: 3,545Jetons de raisonnement: 0Temps de réponse : moy. 1.74s · total 31.32s · max 9.39s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)788msTemps de réponse (max)1.34sTemps de réponse (total)3.15s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.51sTemps de réponse (max)2.51sTemps de réponse (total)2.51s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.39sTemps de réponse (max)9.39sTemps de réponse (total)9.39s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.43sTemps de réponse (max)1.45sTemps de réponse (total)2.86s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)540msTemps de réponse (max)649msTemps de réponse (total)1.62s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.51sTemps de réponse (max)2.51sTemps de réponse (total)2.51s
Suivi des instructions
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)815msTemps de réponse (max)973msTemps de réponse (total)1.63s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 7N'a pas suivi les instructions: 4Temps de réponse (moy.)16.08sTemps de réponse (max)50.92sTemps de réponse (total)176.88s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 51.9%Tests instables: 6…Jetons de sortie: 13,493Jetons de raisonnement: 36,879Temps de réponse : moy. 16.08s · total 176.88s · max 50.92s
Programmation
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)26.33sTemps de réponse (max)26.33sTemps de réponse (total)26.33s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.18sTemps de réponse (max)31.18sTemps de réponse (total)31.18s
Analyse et extraction des données
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.98sTemps de réponse (max)1.98sTemps de réponse (total)1.98s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)50.92sTemps de réponse (max)50.92sTemps de réponse (total)50.92s
Intelligence générale
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)7.90sTemps de réponse (max)7.90sTemps de réponse (total)7.90s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.63sTemps de réponse (max)7.63sTemps de réponse (total)7.63s
Appel d'outils
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.91sTemps de réponse (max)6.91sTemps de réponse (total)6.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 8N'a pas suivi les instructions: 3Temps de réponse (moy.)2.05sTemps de réponse (max)6.65sTemps de réponse (total)36.93s…
Tests totaux: 18Tests incorrects: 11Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 42.6%Tests instables: 2…Jetons de sortie: 2,973Jetons de raisonnement: 0Temps de réponse : moy. 2.05s · total 36.93s · max 6.65s
Astuces anti-IA
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.39sTemps de réponse (max)2.96sTemps de réponse (total)5.56s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.65sTemps de réponse (max)6.65sTemps de réponse (total)6.65s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.38sTemps de réponse (max)3.38sTemps de réponse (total)3.38s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.32sTemps de réponse (max)1.39sTemps de réponse (total)2.64s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.48sTemps de réponse (max)1.85sTemps de réponse (total)4.45s
Intelligence générale
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.55sTemps de réponse (max)1.55sTemps de réponse (total)1.55s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.64sTemps de réponse (max)1.80sTemps de réponse (total)3.28s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.46sTemps de réponse (max)4.46sTemps de réponse (total)4.46s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)1.51sTemps de réponse (max)3.54sTemps de réponse (total)27.21s…
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 46.3%Tests instables: 4…Jetons de sortie: 2,451Jetons de raisonnement: 0Temps de réponse : moy. 1.51s · total 27.21s · max 3.54s
Astuces anti-IA
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.29sTemps de réponse (max)2.83sTemps de réponse (total)5.18s
Programmation
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.39sTemps de réponse (max)2.39sTemps de réponse (total)2.39s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.32sTemps de réponse (max)1.42sTemps de réponse (total)2.64s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)877msTemps de réponse (max)904msTemps de réponse (total)2.63s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.53sTemps de réponse (max)1.53sTemps de réponse (total)1.53s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.03sTemps de réponse (max)1.10sTemps de réponse (total)2.06s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.30sTemps de réponse (max)3.30sTemps de réponse (total)3.30s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 11N'a pas suivi les instructions: 1Temps de réponse (moy.)3.69sTemps de réponse (max)46.00sTemps de réponse (total)66.50s…
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 38.9%Tests instables: 2…Jetons de sortie: 3,341Jetons de raisonnement: 0Temps de réponse : moy. 3.69s · total 66.50s · max 46.00s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.59sTemps de réponse (max)3.60sTemps de réponse (total)6.38s
Programmation
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.44sTemps de réponse (max)3.44sTemps de réponse (total)3.44s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)46.00sTemps de réponse (max)46.00sTemps de réponse (total)46.00s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.01sTemps de réponse (max)1.06sTemps de réponse (total)2.02s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)465msTemps de réponse (max)492msTemps de réponse (total)1.39s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.12sTemps de réponse (max)1.12sTemps de réponse (total)1.12s
Suivi des instructions
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)585msTemps de réponse (max)715msTemps de réponse (total)1.17s
Résolution d'énigmes
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)982msTemps de réponse (max)1.36sTemps de réponse (total)2.95s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.04sTemps de réponse (max)2.04sTemps de réponse (total)2.04s
Tests totaux: 18Tests incorrects: 13Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 57.4%Tests instables: 10…Jetons de sortie: 107,044Jetons de raisonnement: 206,422Temps de réponse : moy. 39.65s · total 396.47s · max 237.27s
Programmation
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Combiné
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)60.39sTemps de réponse (max)60.39sTemps de réponse (total)60.39s
Analyse et extraction des données
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)7.48sTemps de réponse (max)7.48sTemps de réponse (total)7.48s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)237.27sTemps de réponse (max)237.27sTemps de réponse (total)237.27s
Intelligence générale
: 3.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.63sTemps de réponse (max)6.63sTemps de réponse (total)6.63s
Suivi des instructions
: 8.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.64sTemps de réponse (max)4.64sTemps de réponse (total)4.64s
Résolution d'énigmes
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)11.54sTemps de réponse (max)17.37sTemps de réponse (total)23.08s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.35sTemps de réponse (max)15.35sTemps de réponse (total)15.35s
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 46.3%Tests instables: 4…Jetons de sortie: 2,278Jetons de raisonnement: 0Temps de réponse : moy. 4.58s · total 77.92s · max 15.17s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)3.81sTemps de réponse (max)6.85sTemps de réponse (total)15.23s
Programmation
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)15.17sTemps de réponse (max)15.17sTemps de réponse (total)15.17s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.49sTemps de réponse (max)14.02sTemps de réponse (total)16.98s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.33sTemps de réponse (max)2.94sTemps de réponse (total)6.99s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.71sTemps de réponse (max)2.71sTemps de réponse (total)2.71s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.82sTemps de réponse (max)2.92sTemps de réponse (total)5.65s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.02sTemps de réponse (max)6.02sTemps de réponse (total)6.02s
Tests totaux: 18Tests incorrects: 13Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 50.0%Tests instables: 7…Jetons de sortie: 15,084Jetons de raisonnement: 39,408Temps de réponse : moy. 5.64s · total 101.52s · max 30.49s
Astuces anti-IA
: 5.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.67sTemps de réponse (max)5.03sTemps de réponse (total)10.66s
Programmation
: 6.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)30.49sTemps de réponse (max)30.49sTemps de réponse (total)30.49s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)25.25sTemps de réponse (max)25.25sTemps de réponse (total)25.25s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)1.23sTemps de réponse (max)1.96sTemps de réponse (total)2.46s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Mauvaise réponse: 1Temps de réponse (moy.)6.11sTemps de réponse (max)13.72sTemps de réponse (total)18.34s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.05sTemps de réponse (max)2.05sTemps de réponse (total)2.05s
Suivi des instructions
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.38sTemps de réponse (max)1.61sTemps de réponse (total)2.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.50sTemps de réponse (max)3.50sTemps de réponse (total)3.50s
Tests totaux: 18Tests incorrects: 13Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 37.0%Tests instables: 3…Jetons de sortie: 2,489Jetons de raisonnement: 0Temps de réponse : moy. 3.35s · total 36.90s · max 7.05s
Astuces anti-IA
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)5.51sTemps de réponse (max)6.59sTemps de réponse (total)11.02s
Programmation
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)5.57sTemps de réponse (max)5.57sTemps de réponse (total)5.57s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)3.22sTemps de réponse (max)3.22sTemps de réponse (total)3.22s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.82sTemps de réponse (max)4.82sTemps de réponse (total)4.82s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)744msTemps de réponse (max)744msTemps de réponse (total)744ms
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.59sTemps de réponse (max)1.59sTemps de réponse (total)1.59s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)888msTemps de réponse (max)888msTemps de réponse (total)888ms
Appel d'outils
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.05sTemps de réponse (max)7.05sTemps de réponse (total)7.05s
Tests totaux: 18Tests incorrects: 13Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 37.0%Tests instables: 4…Jetons de sortie: 3,720Jetons de raisonnement: 0Temps de réponse : moy. 4.33s · total 78.02s · max 32.57s
Astuces anti-IA
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)2.11sTemps de réponse (max)3.94sTemps de réponse (total)8.46s
Programmation
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.79sTemps de réponse (max)9.79sTemps de réponse (total)9.79s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)32.57sTemps de réponse (max)32.57sTemps de réponse (total)32.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.08sTemps de réponse (max)1.62sTemps de réponse (total)2.15s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.99sTemps de réponse (max)3.99sTemps de réponse (total)5.98s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)790msTemps de réponse (max)790msTemps de réponse (total)790ms
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.58sTemps de réponse (max)1.69sTemps de réponse (total)3.17s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.68sTemps de réponse (max)10.68sTemps de réponse (total)10.68s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12Temps de réponse (moy.)13.37sTemps de réponse (max)42.13sTemps de réponse (total)147.05s…
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 40.7%Tests instables: 3…Jetons de sortie: 2,659Jetons de raisonnement: 0Temps de réponse : moy. 13.37s · total 147.05s · max 42.13s
Astuces anti-IA
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)6.24sTemps de réponse (max)11.38sTemps de réponse (total)12.48s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)38.78sTemps de réponse (max)38.78sTemps de réponse (total)38.78s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)19.16sTemps de réponse (max)19.16sTemps de réponse (total)19.16s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)42.13sTemps de réponse (max)42.13sTemps de réponse (total)42.13s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)4.38sTemps de réponse (max)4.38sTemps de réponse (total)4.38s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.00sTemps de réponse (max)4.00sTemps de réponse (total)4.00s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.67sTemps de réponse (max)2.67sTemps de réponse (total)2.67s
Résolution d'énigmes
: 3.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)4.73sTemps de réponse (max)7.81sTemps de réponse (total)9.45s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.99sTemps de réponse (max)13.99sTemps de réponse (total)13.99s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)2.94sTemps de réponse (max)8.21sTemps de réponse (total)52.98s…
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 37.0%Tests instables: 2…Jetons de sortie: 1,775Jetons de raisonnement: 0Temps de réponse : moy. 2.94s · total 52.98s · max 8.21s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)2.84sTemps de réponse (max)4.15sTemps de réponse (total)11.35s
Programmation
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.93sTemps de réponse (max)3.93sTemps de réponse (total)3.93s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.89sTemps de réponse (max)4.89sTemps de réponse (total)4.89s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.47sTemps de réponse (max)2.48sTemps de réponse (total)4.95s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.97sTemps de réponse (max)2.65sTemps de réponse (total)5.92s
Intelligence générale
: 4.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.18sTemps de réponse (max)2.18sTemps de réponse (total)2.18s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.13sTemps de réponse (max)2.53sTemps de réponse (total)4.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.21sTemps de réponse (max)8.21sTemps de réponse (total)8.21s
Tests totaux: 18Tests incorrects: 12Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 35.2%Tests instables: 1…Jetons de sortie: 3,338Jetons de raisonnement: 0Temps de réponse : moy. 11.33s · total 203.88s · max 35.34s
Astuces anti-IA
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)12.30sTemps de réponse (max)16.60sTemps de réponse (total)49.20s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.21sTemps de réponse (max)11.21sTemps de réponse (total)11.21s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)35.34sTemps de réponse (max)35.34sTemps de réponse (total)35.34s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.48sTemps de réponse (max)12.71sTemps de réponse (total)16.96s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)4.94sTemps de réponse (max)7.65sTemps de réponse (total)14.81s
Intelligence générale
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)11.85sTemps de réponse (max)11.85sTemps de réponse (total)11.85s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.52sTemps de réponse (max)8.19sTemps de réponse (total)11.04s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)18.80sTemps de réponse (max)18.80sTemps de réponse (total)18.80s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 11N'a pas suivi les instructions: 2Temps de réponse (moy.)5.07sTemps de réponse (max)39.47sTemps de réponse (total)91.23s…
Tests totaux: 18Tests incorrects: 13Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 29.6%Tests instables: 1…Jetons de sortie: 1,985Jetons de raisonnement: 0Temps de réponse : moy. 5.07s · total 91.23s · max 39.47s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)3.02sTemps de réponse (max)8.17sTemps de réponse (total)12.07s
Programmation
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)39.47sTemps de réponse (max)39.47sTemps de réponse (total)39.47s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.91sTemps de réponse (max)8.91sTemps de réponse (total)8.91s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.26sTemps de réponse (max)4.66sTemps de réponse (total)6.52s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)877msTemps de réponse (max)894msTemps de réponse (total)2.63s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Résolution d'énigmes
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)3.30sTemps de réponse (max)4.81sTemps de réponse (total)9.91s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.67sTemps de réponse (max)6.67sTemps de réponse (total)6.67s