Tests totaux: 16Tests incorrects: 15Taux de réussite par tentative: 14.6%Tests instables: 2…Jetons de sortie: 1,185Jetons de raisonnement: 0Temps de réponse : moy. 811ms · total 11.35s · max 2.88s
Astuces anti-IA
: 3.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)471msTemps de réponse (max)872msTemps de réponse (total)1.41s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Analyse et extraction des données
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)714msTemps de réponse (max)987msTemps de réponse (total)1.43s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Mauvaise réponse: 1Temps de réponse (moy.)287msTemps de réponse (max)334msTemps de réponse (total)860ms
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)395msTemps de réponse (max)395msTemps de réponse (total)395ms
Suivi des instructions
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.09sTemps de réponse (max)1.90sTemps de réponse (total)2.18s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12N'a pas suivi les instructions: 3Temps de réponse (moy.)1.39sTemps de réponse (max)3.84sTemps de réponse (total)23.70s…
Tests totaux: 17Tests incorrects: 15Taux de réussite par tentative: 29.4%Tests instables: 6…Jetons de sortie: 2,185Jetons de raisonnement: 0Temps de réponse : moy. 1.39s · total 23.70s · max 3.84s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.18sTemps de réponse (max)1.81sTemps de réponse (total)4.70s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.84sTemps de réponse (max)3.84sTemps de réponse (total)3.84s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.11sTemps de réponse (max)1.25sTemps de réponse (total)2.23s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)926msTemps de réponse (max)959msTemps de réponse (total)2.78s
Intelligence générale
: 3.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.31sTemps de réponse (max)1.31sTemps de réponse (total)1.31s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.40sTemps de réponse (max)3.40sTemps de réponse (total)3.40s
Tests totaux: 17Tests incorrects: 14Taux de réussite par tentative: 27.5%Tests instables: 4…Jetons de sortie: 67,796Jetons de raisonnement: 0Temps de réponse : moy. 2.79s · total 36.29s · max 19.68s
Astuces anti-IA
: 3.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.19sTemps de réponse (max)2.73sTemps de réponse (total)4.76s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.87sTemps de réponse (max)2.87sTemps de réponse (total)2.87s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)564msTemps de réponse (max)564msTemps de réponse (total)564ms
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.67sTemps de réponse (max)1.67sTemps de réponse (total)1.67s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)857msTemps de réponse (max)955msTemps de réponse (total)1.71s
Résolution d'énigmes
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.38sTemps de réponse (max)1.74sTemps de réponse (total)2.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.28sTemps de réponse (max)2.28sTemps de réponse (total)2.28s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12N'a pas suivi les instructions: 2Temps de réponse (moy.)1.76sTemps de réponse (max)5.51sTemps de réponse (total)17.56s…
Tests totaux: 17Tests incorrects: 14Taux de réussite par tentative: 23.5%Tests instables: 2…Jetons de sortie: 1,154Jetons de raisonnement: 0Temps de réponse : moy. 1.76s · total 17.56s · max 5.51s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.33sTemps de réponse (max)3.33sTemps de réponse (total)3.33s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)943msTemps de réponse (max)943msTemps de réponse (total)943ms
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.06sTemps de réponse (max)1.06sTemps de réponse (total)1.06s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.08sTemps de réponse (max)1.08sTemps de réponse (total)1.08s
Suivi des instructions
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)923msTemps de réponse (max)923msTemps de réponse (total)923ms
Résolution d'énigmes
: 3.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.28sTemps de réponse (max)1.36sTemps de réponse (total)2.56s
Appel d'outils
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)5.51sTemps de réponse (max)5.51sTemps de réponse (total)5.51s
Tests totaux: 17Tests incorrects: 14Taux de réussite par tentative: 35.3%Tests instables: 6…Jetons de sortie: 18,141Jetons de raisonnement: 141,204Temps de réponse : moy. 69.21s · total 968.99s · max 226.38s
Astuces anti-IA
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Mauvaise réponse: 1Temps de réponse (moy.)34.44sTemps de réponse (max)57.86sTemps de réponse (total)103.31s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 3Temps de réponse (moy.)137.75sTemps de réponse (max)202.61sTemps de réponse (total)413.24s
Intelligence générale
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)226.38sTemps de réponse (max)226.38sTemps de réponse (total)226.38s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)17.15sTemps de réponse (max)28.54sTemps de réponse (total)34.29s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.31sTemps de réponse (max)4.31sTemps de réponse (total)4.31s
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 39.2%Tests instables: 7…Jetons de sortie: 38,719Jetons de raisonnement: 65,465Temps de réponse : moy. 33.44s · total 334.39s · max 174.55s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)65.57sTemps de réponse (max)65.57sTemps de réponse (total)65.57s
Analyse et extraction des données
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)1.51sTemps de réponse (max)1.51sTemps de réponse (total)1.51s
Spécifique au domaine
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Aucune réponse: 1Temps de réponse (moy.)174.55sTemps de réponse (max)174.55sTemps de réponse (total)174.55s
Intelligence générale
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)18.14sTemps de réponse (max)18.14sTemps de réponse (total)18.14s
Suivi des instructions
: 6.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.97sTemps de réponse (max)2.97sTemps de réponse (total)2.97s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.95sTemps de réponse (max)15.95sTemps de réponse (total)15.95s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 5Temps de réponse (moy.)11.57sTemps de réponse (max)81.80sTemps de réponse (total)127.32s…
Tests totaux: 17Tests incorrects: 14Taux de réussite par tentative: 25.5%Tests instables: 2…Jetons de sortie: 2,941Jetons de raisonnement: 0Temps de réponse : moy. 11.57s · total 127.32s · max 81.80s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.28sTemps de réponse (max)4.28sTemps de réponse (total)4.28s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)81.80sTemps de réponse (max)81.80sTemps de réponse (total)81.80s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)638msTemps de réponse (max)638msTemps de réponse (total)638ms
Intelligence générale
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.39sTemps de réponse (max)1.39sTemps de réponse (total)1.39s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.64sTemps de réponse (max)2.64sTemps de réponse (total)2.64s
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 23.5%Tests instables: 0…Jetons de sortie: 2,945Jetons de raisonnement: 0Temps de réponse : moy. 1.22s · total 20.74s · max 5.91s
Astuces anti-IA
: 3.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.71sTemps de réponse (max)3.79sTemps de réponse (total)6.84s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)5.91sTemps de réponse (max)5.91sTemps de réponse (total)5.91s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)847msTemps de réponse (max)1.09sTemps de réponse (total)1.69s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)464msTemps de réponse (max)622msTemps de réponse (total)1.39s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)552msTemps de réponse (max)552msTemps de réponse (total)552ms
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)514msTemps de réponse (max)582msTemps de réponse (total)1.03s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.27sTemps de réponse (max)1.27sTemps de réponse (total)1.27s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 3Temps de réponse (moy.)1.17sTemps de réponse (max)2.52sTemps de réponse (total)19.82s…
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 31.4%Tests instables: 3…Jetons de sortie: 2,085Jetons de raisonnement: 0Temps de réponse : moy. 1.17s · total 19.82s · max 2.52s
Astuces anti-IA
: 3.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)929msTemps de réponse (max)1.55sTemps de réponse (total)3.72s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.52sTemps de réponse (max)2.52sTemps de réponse (total)2.52s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.30sTemps de réponse (max)1.58sTemps de réponse (total)2.61s
Spécifique au domaine
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)937msTemps de réponse (max)1.25sTemps de réponse (total)2.81s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.82sTemps de réponse (max)1.82sTemps de réponse (total)1.82s
Suivi des instructions
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)728msTemps de réponse (max)731msTemps de réponse (total)1.46s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.32sTemps de réponse (max)2.32sTemps de réponse (total)2.32s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12N'a pas suivi les instructions: 1Temps de réponse (moy.)592msTemps de réponse (max)1.27sTemps de réponse (total)10.07s…
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 29.4%Tests instables: 2…Jetons de sortie: 1,315Jetons de raisonnement: 0Temps de réponse : moy. 592ms · total 10.07s · max 1.27s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)483msTemps de réponse (max)716msTemps de réponse (total)1.93s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)606msTemps de réponse (max)606msTemps de réponse (total)606ms
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)667msTemps de réponse (max)819msTemps de réponse (total)1.33s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)534msTemps de réponse (max)733msTemps de réponse (total)1.60s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)628msTemps de réponse (max)628msTemps de réponse (total)628ms
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)551msTemps de réponse (max)622msTemps de réponse (total)1.10s
Résolution d'énigmes
: 3.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)533msTemps de réponse (max)637msTemps de réponse (total)1.60s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.27sTemps de réponse (max)1.27sTemps de réponse (total)1.27s
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 23.5%Tests instables: 0…Jetons de sortie: 3,032Jetons de raisonnement: 0Temps de réponse : moy. 10.82s · total 118.99s · max 45.14s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)45.14sTemps de réponse (max)45.14sTemps de réponse (total)45.14s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.32sTemps de réponse (max)1.32sTemps de réponse (total)1.32s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)962msTemps de réponse (max)962msTemps de réponse (total)962ms
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.34sTemps de réponse (max)1.34sTemps de réponse (total)1.34s
Suivi des instructions
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)7.71sTemps de réponse (max)14.65sTemps de réponse (total)15.42s
Résolution d'énigmes
: 3.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)22.86sTemps de réponse (max)42.58sTemps de réponse (total)45.73s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.47sTemps de réponse (max)2.47sTemps de réponse (total)2.47s
Tests totaux: 17Tests incorrects: 14Taux de réussite par tentative: 49.0%Tests instables: 10…Jetons de sortie: 4,517Jetons de raisonnement: 47,612Temps de réponse : moy. 27.32s · total 437.10s · max 117.04s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)41.03sTemps de réponse (max)41.03sTemps de réponse (total)41.03s
Analyse et extraction des données
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)21.95sTemps de réponse (max)24.88sTemps de réponse (total)43.89s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Mauvaise réponse: 1Temps de réponse (moy.)19.00sTemps de réponse (max)21.63sTemps de réponse (total)38.01s
Intelligence générale
: 3.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)38.70sTemps de réponse (max)38.70sTemps de réponse (total)38.70s
Appel d'outils
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)12.05sTemps de réponse (max)12.05sTemps de réponse (total)12.05s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12N'a pas suivi les instructions: 1Temps de réponse (moy.)1.94sTemps de réponse (max)7.58sTemps de réponse (total)19.44s…
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 23.5%Tests instables: 0…Jetons de sortie: 1,600Jetons de raisonnement: 0Temps de réponse : moy. 1.94s · total 19.44s · max 7.58s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.34sTemps de réponse (max)1.83sTemps de réponse (total)2.67s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.58sTemps de réponse (max)7.58sTemps de réponse (total)7.58s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.27sTemps de réponse (max)1.27sTemps de réponse (total)1.27s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)637msTemps de réponse (max)637msTemps de réponse (total)637ms
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)909msTemps de réponse (max)909msTemps de réponse (total)909ms
Résolution d'énigmes
: 3.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.30sTemps de réponse (max)1.54sTemps de réponse (total)2.60s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.51sTemps de réponse (max)2.51sTemps de réponse (total)2.51s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 4Temps de réponse (moy.)8.86sTemps de réponse (max)24.97sTemps de réponse (total)150.70s…
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 35.3%Tests instables: 3…Jetons de sortie: 4,225Jetons de raisonnement: 0Temps de réponse : moy. 8.86s · total 150.70s · max 24.97s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)7.43sTemps de réponse (max)16.69sTemps de réponse (total)29.72s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)19.98sTemps de réponse (max)19.98sTemps de réponse (total)19.98s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.92sTemps de réponse (max)13.23sTemps de réponse (total)15.84s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)6.23sTemps de réponse (max)14.38sTemps de réponse (total)18.70s
Intelligence générale
: 4.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)24.97sTemps de réponse (max)24.97sTemps de réponse (total)24.97s
Appel d'outils
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)16.00sTemps de réponse (max)16.00sTemps de réponse (total)16.00s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)629msTemps de réponse (max)1.72sTemps de réponse (total)10.70s…
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 33.3%Tests instables: 1…Jetons de sortie: 1,624Jetons de raisonnement: 0Temps de réponse : moy. 629ms · total 10.70s · max 1.72s
Astuces anti-IA
: 3.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)395msTemps de réponse (max)769msTemps de réponse (total)1.58s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.72sTemps de réponse (max)1.72sTemps de réponse (total)1.72s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)822msTemps de réponse (max)1.08sTemps de réponse (total)1.64s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)367msTemps de réponse (max)388msTemps de réponse (total)1.10s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)729msTemps de réponse (max)729msTemps de réponse (total)729ms
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)380msTemps de réponse (max)380msTemps de réponse (total)759ms
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.40sTemps de réponse (max)1.40sTemps de réponse (total)1.40s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)3.04sTemps de réponse (max)8.91sTemps de réponse (total)51.75s…
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 31.4%Tests instables: 1…Jetons de sortie: 1,843Jetons de raisonnement: 0Temps de réponse : moy. 3.04s · total 51.75s · max 8.91s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)3.02sTemps de réponse (max)8.17sTemps de réponse (total)12.07s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.91sTemps de réponse (max)8.91sTemps de réponse (total)8.91s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.26sTemps de réponse (max)4.66sTemps de réponse (total)6.52s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)877msTemps de réponse (max)894msTemps de réponse (total)2.63s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Résolution d'énigmes
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)3.30sTemps de réponse (max)4.81sTemps de réponse (total)9.91s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.67sTemps de réponse (max)6.67sTemps de réponse (total)6.67s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 12Temps de réponse (moy.)10.83sTemps de réponse (max)42.13sTemps de réponse (total)108.27s…
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 37.3%Tests instables: 3…Jetons de sortie: 2,010Jetons de raisonnement: 0Temps de réponse : moy. 10.83s · total 108.27s · max 42.13s
Astuces anti-IA
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)6.24sTemps de réponse (max)11.38sTemps de réponse (total)12.48s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)19.16sTemps de réponse (max)19.16sTemps de réponse (total)19.16s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)42.13sTemps de réponse (max)42.13sTemps de réponse (total)42.13s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)4.38sTemps de réponse (max)4.38sTemps de réponse (total)4.38s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.00sTemps de réponse (max)4.00sTemps de réponse (total)4.00s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.67sTemps de réponse (max)2.67sTemps de réponse (total)2.67s
Résolution d'énigmes
: 3.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)4.73sTemps de réponse (max)7.81sTemps de réponse (total)9.45s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.99sTemps de réponse (max)13.99sTemps de réponse (total)13.99s
Tests totaux: 17Tests incorrects: 13Taux de réussite par tentative: 31.4%Tests instables: 2…Jetons de sortie: 1,517Jetons de raisonnement: 0Temps de réponse : moy. 1.19s · total 20.22s · max 6.48s
Astuces anti-IA
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)597msTemps de réponse (max)866msTemps de réponse (total)2.39s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)6.48sTemps de réponse (max)6.48sTemps de réponse (total)6.48s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)601msTemps de réponse (max)634msTemps de réponse (total)1.20s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)611msTemps de réponse (max)616msTemps de réponse (total)1.83s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)541msTemps de réponse (max)541msTemps de réponse (total)541ms
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.79sTemps de réponse (max)4.79sTemps de réponse (total)4.79s
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 39.2%Tests instables: 3…Jetons de sortie: 1,863Jetons de raisonnement: 0Temps de réponse : moy. 3.13s · total 31.33s · max 7.05s
Astuces anti-IA
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)5.51sTemps de réponse (max)6.59sTemps de réponse (total)11.02s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)3.22sTemps de réponse (max)3.22sTemps de réponse (total)3.22s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.82sTemps de réponse (max)4.82sTemps de réponse (total)4.82s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)744msTemps de réponse (max)744msTemps de réponse (total)744ms
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.59sTemps de réponse (max)1.59sTemps de réponse (total)1.59s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)888msTemps de réponse (max)888msTemps de réponse (total)888ms
Appel d'outils
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.05sTemps de réponse (max)7.05sTemps de réponse (total)7.05s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)2.89sTemps de réponse (max)8.21sTemps de réponse (total)49.05s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 37.3%Tests instables: 1…Jetons de sortie: 1,270Jetons de raisonnement: 0Temps de réponse : moy. 2.89s · total 49.05s · max 8.21s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)2.84sTemps de réponse (max)4.15sTemps de réponse (total)11.35s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.89sTemps de réponse (max)4.89sTemps de réponse (total)4.89s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.47sTemps de réponse (max)2.48sTemps de réponse (total)4.95s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.97sTemps de réponse (max)2.65sTemps de réponse (total)5.92s
Intelligence générale
: 4.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.18sTemps de réponse (max)2.18sTemps de réponse (total)2.18s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.13sTemps de réponse (max)2.53sTemps de réponse (total)4.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.21sTemps de réponse (max)8.21sTemps de réponse (total)8.21s
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 49.0%Tests instables: 6…Jetons de sortie: 12,288Jetons de raisonnement: 28,112Temps de réponse : moy. 4.18s · total 71.03s · max 25.25s
Astuces anti-IA
: 5.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.67sTemps de réponse (max)5.03sTemps de réponse (total)10.66s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)25.25sTemps de réponse (max)25.25sTemps de réponse (total)25.25s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)1.23sTemps de réponse (max)1.96sTemps de réponse (total)2.46s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Mauvaise réponse: 1Temps de réponse (moy.)6.11sTemps de réponse (max)13.72sTemps de réponse (total)18.34s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.05sTemps de réponse (max)2.05sTemps de réponse (total)2.05s
Suivi des instructions
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.38sTemps de réponse (max)1.61sTemps de réponse (total)2.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.50sTemps de réponse (max)3.50sTemps de réponse (total)3.50s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 2Temps de réponse (moy.)1.70sTemps de réponse (max)9.39sTemps de réponse (total)28.82s…
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 35.3%Tests instables: 2…Jetons de sortie: 3,164Jetons de raisonnement: 0Temps de réponse : moy. 1.70s · total 28.82s · max 9.39s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)788msTemps de réponse (max)1.34sTemps de réponse (total)3.15s
Combiné
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.39sTemps de réponse (max)9.39sTemps de réponse (total)9.39s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.43sTemps de réponse (max)1.45sTemps de réponse (total)2.86s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)540msTemps de réponse (max)649msTemps de réponse (total)1.62s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.51sTemps de réponse (max)2.51sTemps de réponse (total)2.51s
Suivi des instructions
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)815msTemps de réponse (max)973msTemps de réponse (total)1.63s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 1Temps de réponse (moy.)1.43sTemps de réponse (max)2.89sTemps de réponse (total)24.27s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 39.2%Tests instables: 2…Jetons de sortie: 1,837Jetons de raisonnement: 0Temps de réponse : moy. 1.43s · total 24.27s · max 2.89s
Astuces anti-IA
: 3.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.21sTemps de réponse (max)2.58sTemps de réponse (total)4.85s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.89sTemps de réponse (max)2.89sTemps de réponse (total)2.89s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.04sTemps de réponse (max)1.06sTemps de réponse (total)2.08s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.07sTemps de réponse (max)1.54sTemps de réponse (total)3.22s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.78sTemps de réponse (max)1.78sTemps de réponse (total)1.78s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.07sTemps de réponse (max)1.17sTemps de réponse (total)2.15s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.75sTemps de réponse (max)2.75sTemps de réponse (total)2.75s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)2.31sTemps de réponse (max)6.58sTemps de réponse (total)39.25s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 45.1%Tests instables: 3…Jetons de sortie: 1,721Jetons de raisonnement: 0Temps de réponse : moy. 2.31s · total 39.25s · max 6.58s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.80sTemps de réponse (max)2.62sTemps de réponse (total)7.19s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.58sTemps de réponse (max)6.58sTemps de réponse (total)6.58s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.39sTemps de réponse (max)1.42sTemps de réponse (total)2.78s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.78sTemps de réponse (max)2.49sTemps de réponse (total)5.34s
Intelligence générale
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.44sTemps de réponse (max)2.44sTemps de réponse (total)2.44s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.51sTemps de réponse (max)2.95sTemps de réponse (total)5.02s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.39sTemps de réponse (max)4.39sTemps de réponse (total)4.39s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 1Temps de réponse (moy.)3.71sTemps de réponse (max)46.00sTemps de réponse (total)63.06s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 37.3%Tests instables: 1…Jetons de sortie: 2,682Jetons de raisonnement: 0Temps de réponse : moy. 3.71s · total 63.06s · max 46.00s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.59sTemps de réponse (max)3.60sTemps de réponse (total)6.38s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)46.00sTemps de réponse (max)46.00sTemps de réponse (total)46.00s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.01sTemps de réponse (max)1.06sTemps de réponse (total)2.02s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)465msTemps de réponse (max)492msTemps de réponse (total)1.39s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.12sTemps de réponse (max)1.12sTemps de réponse (total)1.12s
Suivi des instructions
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)585msTemps de réponse (max)715msTemps de réponse (total)1.17s
Résolution d'énigmes
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)982msTemps de réponse (max)1.36sTemps de réponse (total)2.95s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.04sTemps de réponse (max)2.04sTemps de réponse (total)2.04s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)4.58sTemps de réponse (max)15.17sTemps de réponse (total)77.92s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 49.0%Tests instables: 4…Jetons de sortie: 2,278Jetons de raisonnement: 0Temps de réponse : moy. 4.58s · total 77.92s · max 15.17s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)3.81sTemps de réponse (max)6.85sTemps de réponse (total)15.23s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)15.17sTemps de réponse (max)15.17sTemps de réponse (total)15.17s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.49sTemps de réponse (max)14.02sTemps de réponse (total)16.98s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.33sTemps de réponse (max)2.94sTemps de réponse (total)6.99s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.71sTemps de réponse (max)2.71sTemps de réponse (total)2.71s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.82sTemps de réponse (max)2.92sTemps de réponse (total)5.65s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.02sTemps de réponse (max)6.02sTemps de réponse (total)6.02s
Tests totaux: 17Tests incorrects: 12Taux de réussite par tentative: 60.8%Tests instables: 10…Jetons de sortie: 107,044Jetons de raisonnement: 206,422Temps de réponse : moy. 39.65s · total 396.47s · max 237.27s
Combiné
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)60.39sTemps de réponse (max)60.39sTemps de réponse (total)60.39s
Analyse et extraction des données
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)7.48sTemps de réponse (max)7.48sTemps de réponse (total)7.48s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)237.27sTemps de réponse (max)237.27sTemps de réponse (total)237.27s
Intelligence générale
: 3.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.63sTemps de réponse (max)6.63sTemps de réponse (total)6.63s
Suivi des instructions
: 8.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.64sTemps de réponse (max)4.64sTemps de réponse (total)4.64s
Résolution d'énigmes
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)11.54sTemps de réponse (max)17.37sTemps de réponse (total)23.08s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.35sTemps de réponse (max)15.35sTemps de réponse (total)15.35s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 2Temps de réponse (moy.)3.89sTemps de réponse (max)47.43sTemps de réponse (total)66.07s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 47.1%Tests instables: 3…Jetons de sortie: 3,761Jetons de raisonnement: 0Temps de réponse : moy. 3.89s · total 66.07s · max 47.43s
Astuces anti-IA
: 3.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.43sTemps de réponse (max)4.39sTemps de réponse (total)5.71s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)47.43sTemps de réponse (max)47.43sTemps de réponse (total)47.43s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.16sTemps de réponse (max)1.42sTemps de réponse (total)2.33s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)485msTemps de réponse (max)549msTemps de réponse (total)1.45s
Intelligence générale
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.19sTemps de réponse (max)1.19sTemps de réponse (total)1.19s
Suivi des instructions
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)809msTemps de réponse (max)983msTemps de réponse (total)1.62s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.30sTemps de réponse (max)2.30sTemps de réponse (total)2.30s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10N'a pas suivi les instructions: 1Temps de réponse (moy.)888msTemps de réponse (max)4.39sTemps de réponse (total)15.10s…
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 41.2%Tests instables: 2…Jetons de sortie: 1,273Jetons de raisonnement: 0Temps de réponse : moy. 888ms · total 15.10s · max 4.39s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)582msTemps de réponse (max)844msTemps de réponse (total)2.33s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.39sTemps de réponse (max)4.39sTemps de réponse (total)4.39s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)652msTemps de réponse (max)660msTemps de réponse (total)1.30s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)495msTemps de réponse (max)642msTemps de réponse (total)1.49s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)615msTemps de réponse (max)615msTemps de réponse (total)615ms
Suivi des instructions
: 8.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)672msTemps de réponse (max)785msTemps de réponse (total)1.34s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.91sTemps de réponse (max)1.91sTemps de réponse (total)1.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 10Temps de réponse (moy.)2.40sTemps de réponse (max)6.70sTemps de réponse (total)40.85s…
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 52.9%Tests instables: 5…Jetons de sortie: 2,749Jetons de raisonnement: 0Temps de réponse : moy. 2.40s · total 40.85s · max 6.70s
Astuces anti-IA
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)2.43sTemps de réponse (max)6.70sTemps de réponse (total)9.73s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.59sTemps de réponse (max)6.59sTemps de réponse (total)6.59s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.82sTemps de réponse (max)1.97sTemps de réponse (total)3.63s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.33sTemps de réponse (max)1.53sTemps de réponse (total)4.00s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.45sTemps de réponse (max)3.45sTemps de réponse (total)3.45s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.06sTemps de réponse (max)1.09sTemps de réponse (total)2.12s
Résolution d'énigmes
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.46sTemps de réponse (max)4.23sTemps de réponse (total)7.37s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.94sTemps de réponse (max)3.94sTemps de réponse (total)3.94s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 6N'a pas suivi les instructions: 4Temps de réponse (moy.)15.05sTemps de réponse (max)50.92sTemps de réponse (total)150.55s…
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 51.0%Tests instables: 5…Jetons de sortie: 13,265Jetons de raisonnement: 34,330Temps de réponse : moy. 15.05s · total 150.55s · max 50.92s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.18sTemps de réponse (max)31.18sTemps de réponse (total)31.18s
Analyse et extraction des données
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.98sTemps de réponse (max)1.98sTemps de réponse (total)1.98s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)50.92sTemps de réponse (max)50.92sTemps de réponse (total)50.92s
Intelligence générale
: 4.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)7.90sTemps de réponse (max)7.90sTemps de réponse (total)7.90s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.63sTemps de réponse (max)7.63sTemps de réponse (total)7.63s
Appel d'outils
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.91sTemps de réponse (max)6.91sTemps de réponse (total)6.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 9N'a pas suivi les instructions: 1Temps de réponse (moy.)3.36sTemps de réponse (max)13.73sTemps de réponse (total)57.15s…
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 43.1%Tests instables: 1…Jetons de sortie: 3,777Jetons de raisonnement: 0Temps de réponse : moy. 3.36s · total 57.15s · max 13.73s
Astuces anti-IA
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4Temps de réponse (moy.)1.32sTemps de réponse (max)3.89sTemps de réponse (total)5.30s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.22sTemps de réponse (max)6.22sTemps de réponse (total)6.22s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.57sTemps de réponse (max)1.83sTemps de réponse (total)3.14s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)905msTemps de réponse (max)1.10sTemps de réponse (total)2.71s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)803msTemps de réponse (max)803msTemps de réponse (total)803ms
Suivi des instructions
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)8.81sTemps de réponse (max)13.73sTemps de réponse (total)17.61s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.67sTemps de réponse (max)3.67sTemps de réponse (total)3.67s
Tests totaux: 17Tests incorrects: 11Taux de réussite par tentative: 54.9%Tests instables: 6…Jetons de sortie: 298,948Jetons de raisonnement: 296,529Temps de réponse : moy. 8.64s · total 129.64s · max 35.28s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.54sTemps de réponse (max)7.51sTemps de réponse (total)11.08s
Intelligence générale
: 5.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.40sTemps de réponse (max)6.40sTemps de réponse (total)6.40s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.63sTemps de réponse (max)5.46sTemps de réponse (total)9.26s
Résolution d'énigmes
: 7.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)5.01sTemps de réponse (max)5.49sTemps de réponse (total)15.03s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 58.8%Tests instables: 7…Jetons de sortie: 4,500Jetons de raisonnement: 143,296Temps de réponse : moy. 44.47s · total 444.74s · max 204.02s
Astuces anti-IA
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)25.50sTemps de réponse (max)37.73sTemps de réponse (total)51.00s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)65.96sTemps de réponse (max)65.96sTemps de réponse (total)65.96s
Analyse et extraction des données
: 3.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)21.42sTemps de réponse (max)21.42sTemps de réponse (total)21.42s
Spécifique au domaine
: 5.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)204.02sTemps de réponse (max)204.02sTemps de réponse (total)204.02s
Intelligence générale
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)17.51sTemps de réponse (max)17.51sTemps de réponse (total)17.51s
Suivi des instructions
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)11.90sTemps de réponse (max)11.90sTemps de réponse (total)11.90s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)33.30sTemps de réponse (max)33.30sTemps de réponse (total)33.30s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 6N'a pas suivi les instructions: 4Temps de réponse (moy.)2.25sTemps de réponse (max)14.63sTemps de réponse (total)35.99s…
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 51.0%Tests instables: 3…Jetons de sortie: 3,723Jetons de raisonnement: 46,120Temps de réponse : moy. 2.25s · total 35.99s · max 14.63s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.28sTemps de réponse (max)3.28sTemps de réponse (total)3.28s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.11sTemps de réponse (max)1.47sTemps de réponse (total)2.21s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)6.48sTemps de réponse (max)14.63sTemps de réponse (total)19.43s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)821msTemps de réponse (max)821msTemps de réponse (total)821ms
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.07sTemps de réponse (max)1.07sTemps de réponse (total)1.07s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.89sTemps de réponse (max)1.89sTemps de réponse (total)1.89s
Tests totaux: 17Tests incorrects: 10Taux de réussite par tentative: 51.0%Tests instables: 3…Jetons de sortie: 7,831Jetons de raisonnement: 0Temps de réponse : moy. 12.35s · total 209.94s · max 115.89s
Combiné
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)115.89sTemps de réponse (max)115.89sTemps de réponse (total)115.89s
Analyse et extraction des données
: 6.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)9.42sTemps de réponse (max)16.20sTemps de réponse (total)18.84s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.61sTemps de réponse (max)1.77sTemps de réponse (total)4.83s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.52sTemps de réponse (max)1.99sTemps de réponse (total)3.04s
Résolution d'énigmes
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.37sTemps de réponse (max)10.78sTemps de réponse (total)22.10s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.85sTemps de réponse (max)11.85sTemps de réponse (total)11.85s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 7N'a pas suivi les instructions: 2Temps de réponse (moy.)2.01sTemps de réponse (max)6.81sTemps de réponse (total)34.09s…
Tests totaux: 17Tests incorrects: 9Taux de réussite par tentative: 47.1%Tests instables: 0…Jetons de sortie: 469Jetons de raisonnement: 0Temps de réponse : moy. 2.01s · total 34.09s · max 6.81s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.10sTemps de réponse (max)2.08sTemps de réponse (total)4.39s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.47sTemps de réponse (max)2.47sTemps de réponse (total)2.47s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.69sTemps de réponse (max)2.46sTemps de réponse (total)3.38s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.14sTemps de réponse (max)1.63sTemps de réponse (total)3.41s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.19sTemps de réponse (max)1.19sTemps de réponse (total)1.19s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.18sTemps de réponse (max)6.81sTemps de réponse (total)8.36s
Résolution d'énigmes
: 8.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.71sTemps de réponse (max)5.96sTemps de réponse (total)8.14s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.76sTemps de réponse (max)2.76sTemps de réponse (total)2.76s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 8Temps de réponse (moy.)3.77sTemps de réponse (max)11.07sTemps de réponse (total)37.66s…
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 52.9%Tests instables: 0…Jetons de sortie: 1,551Jetons de raisonnement: 0Temps de réponse : moy. 3.77s · total 37.66s · max 11.07s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.37sTemps de réponse (max)3.39sTemps de réponse (total)4.75s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.98sTemps de réponse (max)4.98sTemps de réponse (total)4.98s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.78sTemps de réponse (max)5.78sTemps de réponse (total)5.78s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)2.24sTemps de réponse (max)2.24sTemps de réponse (total)2.24s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.27sTemps de réponse (max)3.27sTemps de réponse (total)3.27s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.48sTemps de réponse (max)1.48sTemps de réponse (total)1.48s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.05sTemps de réponse (max)2.08sTemps de réponse (total)4.10s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.07sTemps de réponse (max)11.07sTemps de réponse (total)11.07s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 8Temps de réponse (moy.)2.51sTemps de réponse (max)6.65sTemps de réponse (total)27.60s…
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 54.9%Tests instables: 1…Jetons de sortie: 2,018Jetons de raisonnement: 0Temps de réponse : moy. 2.51s · total 27.60s · max 6.65s
Astuces anti-IA
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)1.91sTemps de réponse (max)2.74sTemps de réponse (total)3.82s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.65sTemps de réponse (max)6.65sTemps de réponse (total)6.65s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.89sTemps de réponse (max)1.89sTemps de réponse (total)1.89s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)1.17sTemps de réponse (max)1.44sTemps de réponse (total)2.33s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.26sTemps de réponse (max)2.26sTemps de réponse (total)2.26s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.67sTemps de réponse (max)1.67sTemps de réponse (total)1.67s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.82sTemps de réponse (max)3.52sTemps de réponse (total)5.65s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.33sTemps de réponse (max)3.33sTemps de réponse (total)3.33s
Tests totaux: 17Tests incorrects: 9Taux de réussite par tentative: 58.8%Tests instables: 3…Jetons de sortie: 5,896Jetons de raisonnement: 49,322Temps de réponse : moy. 24.02s · total 408.39s · max 88.15s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)88.15sTemps de réponse (max)88.15sTemps de réponse (total)88.15s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.58sTemps de réponse (max)13.87sTemps de réponse (total)25.16s
Spécifique au domaine
: 3.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)44.63sTemps de réponse (max)82.55sTemps de réponse (total)133.89s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)13.50sTemps de réponse (max)13.50sTemps de réponse (total)13.50s
Suivi des instructions
: 8.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)15.66sTemps de réponse (max)21.80sTemps de réponse (total)31.32s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)18.64sTemps de réponse (max)18.64sTemps de réponse (total)18.64s
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 58.8%Tests instables: 3…Jetons de sortie: 11,947Jetons de raisonnement: 29,768Temps de réponse : moy. 19.06s · total 305.04s · max 87.80s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.08sTemps de réponse (max)22.30sTemps de réponse (total)40.30s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)87.80sTemps de réponse (max)87.80sTemps de réponse (total)87.80s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)18.16sTemps de réponse (max)20.65sTemps de réponse (total)36.33s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)16.19sTemps de réponse (max)21.56sTemps de réponse (total)32.39s
Intelligence générale
: 3.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)27.86sTemps de réponse (max)27.86sTemps de réponse (total)27.86s
Suivi des instructions
: 7.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)7.72sTemps de réponse (max)11.23sTemps de réponse (total)15.45s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)39.75sTemps de réponse (max)39.75sTemps de réponse (total)39.75s
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 66.7%Tests instables: 5…Jetons de sortie: 1,189Jetons de raisonnement: 84,595Temps de réponse : moy. 23.91s · total 239.09s · max 121.79s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.81sTemps de réponse (max)5.65sTemps de réponse (total)7.62s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)37.64sTemps de réponse (max)37.64sTemps de réponse (total)37.64s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.63sTemps de réponse (max)6.63sTemps de réponse (total)6.63s
Spécifique au domaine
: 5.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)121.79sTemps de réponse (max)121.79sTemps de réponse (total)121.79s
Intelligence générale
: 4.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)16.25sTemps de réponse (max)16.25sTemps de réponse (total)16.25s
Suivi des instructions
: 6.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.30sTemps de réponse (max)5.30sTemps de réponse (total)5.30s
Appel d'outils
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)27.71sTemps de réponse (max)27.71sTemps de réponse (total)27.71s
Tests totaux: 17Tests incorrects: 9Taux de réussite par tentative: 68.6%Tests instables: 6…Jetons de sortie: 4,724Jetons de raisonnement: 17,921Temps de réponse : moy. 10.33s · total 175.60s · max 30.53s
Astuces anti-IA
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)4.75sTemps de réponse (max)7.62sTemps de réponse (total)19.00s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)30.53sTemps de réponse (max)30.53sTemps de réponse (total)30.53s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.16sTemps de réponse (max)26.55sTemps de réponse (total)46.33s
Intelligence générale
: 7.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.44sTemps de réponse (max)6.44sTemps de réponse (total)6.44s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.18sTemps de réponse (max)4.46sTemps de réponse (total)8.36s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.33sTemps de réponse (max)17.33sTemps de réponse (total)17.33s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 5Mauvaise réponse: 4Temps de réponse (moy.)15.66sTemps de réponse (max)102.91sTemps de réponse (total)266.14s…
Tests totaux: 17Tests incorrects: 9Taux de réussite par tentative: 68.6%Tests instables: 6…Jetons de sortie: 1,708Jetons de raisonnement: 58,019Temps de réponse : moy. 15.66s · total 266.14s · max 102.91s
Astuces anti-IA
: 8.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.05sTemps de réponse (max)6.69sTemps de réponse (total)16.20s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.81sTemps de réponse (max)17.81sTemps de réponse (total)17.81s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.43sTemps de réponse (max)3.39sTemps de réponse (total)4.87s
Spécifique au domaine
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)65.31sTemps de réponse (max)102.91sTemps de réponse (total)195.92s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.72sTemps de réponse (max)3.72sTemps de réponse (total)3.72s
Suivi des instructions
: 7.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.50sTemps de réponse (max)2.55sTemps de réponse (total)5.00s
Résolution d'énigmes
: 6.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)4.33sTemps de réponse (max)7.27sTemps de réponse (total)13.00s
Appel d'outils
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)9.62sTemps de réponse (max)9.62sTemps de réponse (total)9.62s
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 72.6%Tests instables: 6…Jetons de sortie: 40,907Jetons de raisonnement: 75,121Temps de réponse : moy. 64.59s · total 645.93s · max 137.29s
Astuces anti-IA
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Mauvaise réponse: 1Temps de réponse (moy.)51.38sTemps de réponse (max)85.28sTemps de réponse (total)102.75s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)71.37sTemps de réponse (max)71.37sTemps de réponse (total)71.37s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)49.78sTemps de réponse (max)49.78sTemps de réponse (total)49.78s
Spécifique au domaine
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)137.29sTemps de réponse (max)137.29sTemps de réponse (total)137.29s
Intelligence générale
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)69.73sTemps de réponse (max)69.73sTemps de réponse (total)69.73s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)92.47sTemps de réponse (max)92.47sTemps de réponse (total)92.47s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.74sTemps de réponse (max)31.74sTemps de réponse (total)31.74s
Tests totaux: 17Tests incorrects: 7Taux de réussite par tentative: 62.8%Tests instables: 1…Jetons de sortie: 6,910Jetons de raisonnement: 0Temps de réponse : moy. 5.12s · total 51.16s · max 23.84s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.84sTemps de réponse (max)23.84sTemps de réponse (total)23.84s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.43sTemps de réponse (max)3.43sTemps de réponse (total)3.43s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.56sTemps de réponse (max)2.56sTemps de réponse (total)2.56s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.96sTemps de réponse (max)1.96sTemps de réponse (total)1.96s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)2.92sTemps de réponse (max)3.33sTemps de réponse (total)5.84s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.11sTemps de réponse (max)4.11sTemps de réponse (total)4.11s
Tests totaux: 17Tests incorrects: 8Taux de réussite par tentative: 78.4%Tests instables: 7…Jetons de sortie: 5,864Jetons de raisonnement: 175,683Temps de réponse : moy. 42.48s · total 722.12s · max 106.00s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)21.13sTemps de réponse (max)34.96sTemps de réponse (total)84.53s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)75.34sTemps de réponse (max)75.34sTemps de réponse (total)75.34s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)59.33sTemps de réponse (max)97.12sTemps de réponse (total)118.65s
Spécifique au domaine
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Mauvaise réponse: 1Temps de réponse (moy.)88.34sTemps de réponse (max)106.00sTemps de réponse (total)265.01s
Intelligence générale
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)30.30sTemps de réponse (max)30.30sTemps de réponse (total)30.30s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.45sTemps de réponse (max)43.36sTemps de réponse (total)48.89s
Résolution d'énigmes
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)31.58sTemps de réponse (max)60.18sTemps de réponse (total)94.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.65sTemps de réponse (max)4.65sTemps de réponse (total)4.65s
Tests totaux: 17Tests incorrects: 7Taux de réussite par tentative: 70.6%Tests instables: 4…Jetons de sortie: 2,238Jetons de raisonnement: 16,811Temps de réponse : moy. 13.93s · total 139.29s · max 77.80s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.06sTemps de réponse (max)14.06sTemps de réponse (total)14.06s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.15sTemps de réponse (max)3.15sTemps de réponse (total)3.15s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)77.80sTemps de réponse (max)77.80sTemps de réponse (total)77.80s
Intelligence générale
: 3.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.32sTemps de réponse (max)4.32sTemps de réponse (total)4.32s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.12sTemps de réponse (max)3.12sTemps de réponse (total)3.12s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.47sTemps de réponse (max)6.45sTemps de réponse (total)10.94s
Appel d'outils
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)10.30sTemps de réponse (max)10.30sTemps de réponse (total)10.30s
Tests totaux: 17Tests incorrects: 7Taux de réussite par tentative: 64.7%Tests instables: 2…Jetons de sortie: 1,971Jetons de raisonnement: 58,624Temps de réponse : moy. 60.58s · total 848.16s · max 262.83s
Astuces anti-IA
: 6.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)74.75sTemps de réponse (max)182.10sTemps de réponse (total)298.98s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)262.83sTemps de réponse (max)262.83sTemps de réponse (total)262.83s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.27sTemps de réponse (max)27.52sTemps de réponse (total)48.54s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 3Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)36.65sTemps de réponse (max)36.65sTemps de réponse (total)36.65s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.47sTemps de réponse (max)19.46sTemps de réponse (total)34.93s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)25.85sTemps de réponse (max)32.95sTemps de réponse (total)77.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)88.68sTemps de réponse (max)88.68sTemps de réponse (total)88.68s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 3Temps de réponse (moy.)11.08sTemps de réponse (max)94.06sTemps de réponse (total)188.39s…
Tests totaux: 17Tests incorrects: 7Taux de réussite par tentative: 66.7%Tests instables: 2…Jetons de sortie: 2,474Jetons de raisonnement: 54,516Temps de réponse : moy. 11.08s · total 188.39s · max 94.06s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.52sTemps de réponse (max)7.74sTemps de réponse (total)18.10s
Combiné
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.13sTemps de réponse (max)24.13sTemps de réponse (total)24.13s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.54sTemps de réponse (max)3.33sTemps de réponse (total)5.08s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)38.18sTemps de réponse (max)94.06sTemps de réponse (total)114.53s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.15sTemps de réponse (max)4.15sTemps de réponse (total)4.15s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.88sTemps de réponse (max)2.61sTemps de réponse (total)3.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.71sTemps de réponse (max)7.71sTemps de réponse (total)7.71s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 4Mauvaise réponse: 2Temps de réponse (moy.)20.87sTemps de réponse (max)83.40sTemps de réponse (total)208.73s…
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 68.6%Tests instables: 2…Jetons de sortie: 26,343Jetons de raisonnement: 17,434Temps de réponse : moy. 20.87s · total 208.73s · max 83.40s
Astuces anti-IA
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 2Temps de réponse (moy.)7.45sTemps de réponse (max)11.88sTemps de réponse (total)14.90s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)76.66sTemps de réponse (max)76.66sTemps de réponse (total)76.66s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.37sTemps de réponse (max)7.37sTemps de réponse (total)7.37s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.04sTemps de réponse (max)5.04sTemps de réponse (total)5.04s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.43sTemps de réponse (max)2.43sTemps de réponse (total)2.43s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.60sTemps de réponse (max)4.66sTemps de réponse (total)9.20s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.73sTemps de réponse (max)9.73sTemps de réponse (total)9.73s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5N'a pas suivi les instructions: 2Temps de réponse (moy.)5.68sTemps de réponse (max)18.33sTemps de réponse (total)96.58s…
Tests totaux: 17Tests incorrects: 7Taux de réussite par tentative: 66.7%Tests instables: 3…Jetons de sortie: 19,348Jetons de raisonnement: 0Temps de réponse : moy. 5.68s · total 96.58s · max 18.33s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.96sTemps de réponse (max)11.96sTemps de réponse (total)11.96s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.21sTemps de réponse (max)2.52sTemps de réponse (total)4.42s
Spécifique au domaine
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)13.01sTemps de réponse (max)18.33sTemps de réponse (total)39.04s
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.99sTemps de réponse (max)1.99sTemps de réponse (total)1.99s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.29sTemps de réponse (max)4.18sTemps de réponse (total)6.59s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.93sTemps de réponse (max)3.05sTemps de réponse (total)8.78s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.36sTemps de réponse (max)8.36sTemps de réponse (total)8.36s
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 70.6%Tests instables: 2…Jetons de sortie: 11,959Jetons de raisonnement: 111,534Temps de réponse : moy. 24.30s · total 267.31s · max 96.01s
Astuces anti-IA
: 8.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)15.85sTemps de réponse (max)20.83sTemps de réponse (total)47.55s
Combiné
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)75.68sTemps de réponse (max)75.68sTemps de réponse (total)75.68s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)96.01sTemps de réponse (max)96.01sTemps de réponse (total)96.01s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.20sTemps de réponse (max)4.20sTemps de réponse (total)4.20s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.28sTemps de réponse (max)7.37sTemps de réponse (total)8.55s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.77sTemps de réponse (max)5.26sTemps de réponse (total)7.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)27.78sTemps de réponse (max)27.78sTemps de réponse (total)27.78s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5N'a pas suivi les instructions: 1Temps de réponse (moy.)6.72sTemps de réponse (max)38.52sTemps de réponse (total)114.20s…
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 74.5%Tests instables: 3…Jetons de sortie: 16,001Jetons de raisonnement: 0Temps de réponse : moy. 6.72s · total 114.20s · max 38.52s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.40sTemps de réponse (max)4.78sTemps de réponse (total)13.59s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.12sTemps de réponse (max)9.12sTemps de réponse (total)9.12s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.05sTemps de réponse (max)3.33sTemps de réponse (total)6.10s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)17.78sTemps de réponse (max)38.52sTemps de réponse (total)53.33s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.20sTemps de réponse (max)3.20sTemps de réponse (total)3.20s
Suivi des instructions
: 7.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)5.46sTemps de réponse (max)6.45sTemps de réponse (total)10.92s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.42sTemps de réponse (max)5.04sTemps de réponse (total)13.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.68sTemps de réponse (max)4.68sTemps de réponse (total)4.68s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 2Temps de réponse (moy.)1.29sTemps de réponse (max)3.39sTemps de réponse (total)21.95s…
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 68.6%Tests instables: 1…Jetons de sortie: 4,721Jetons de raisonnement: 0Temps de réponse : moy. 1.29s · total 21.95s · max 3.39s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.20sTemps de réponse (max)3.20sTemps de réponse (total)3.20s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.22sTemps de réponse (max)1.33sTemps de réponse (total)2.44s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)942msTemps de réponse (max)1.12sTemps de réponse (total)2.83s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)741msTemps de réponse (max)741msTemps de réponse (total)741ms
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.13sTemps de réponse (max)1.14sTemps de réponse (total)2.27s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)972msTemps de réponse (max)1.13sTemps de réponse (total)2.92s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.39sTemps de réponse (max)3.39sTemps de réponse (total)3.39s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 3Mauvaise réponse: 3Temps de réponse (moy.)26.78sTemps de réponse (max)170.45sTemps de réponse (total)294.58s…
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 70.6%Tests instables: 2…Jetons de sortie: 71,904Jetons de raisonnement: 155,607Temps de réponse : moy. 26.78s · total 294.58s · max 170.45s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.56sTemps de réponse (max)32.30sTemps de réponse (total)40.68s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)29.57sTemps de réponse (max)29.57sTemps de réponse (total)29.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.01sTemps de réponse (max)15.01sTemps de réponse (total)15.01s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)170.45sTemps de réponse (max)170.45sTemps de réponse (total)170.45s
Intelligence générale
: 5.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.54sTemps de réponse (max)6.54sTemps de réponse (total)6.54s
Suivi des instructions
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.98sTemps de réponse (max)4.98sTemps de réponse (total)4.98s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.91sTemps de réponse (max)11.91sTemps de réponse (total)11.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 3Mauvaise réponse: 3Temps de réponse (moy.)8.54sTemps de réponse (max)24.21sTemps de réponse (total)145.26s…
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 72.6%Tests instables: 2…Jetons de sortie: 1,487Jetons de raisonnement: 87,922Temps de réponse : moy. 8.54s · total 145.26s · max 24.21s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.16sTemps de réponse (max)3.44sTemps de réponse (total)12.65s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.93sTemps de réponse (max)20.93sTemps de réponse (total)20.93s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.01sTemps de réponse (max)4.27sTemps de réponse (total)8.02s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)21.33sTemps de réponse (max)24.21sTemps de réponse (total)64.00s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.78sTemps de réponse (max)5.78sTemps de réponse (total)5.78s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.97sTemps de réponse (max)6.05sTemps de réponse (total)9.94s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.85sTemps de réponse (max)4.53sTemps de réponse (total)11.55s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)12.39sTemps de réponse (max)12.39sTemps de réponse (total)12.39s
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 64.7%Tests instables: 0…Jetons de sortie: 663Jetons de raisonnement: 39,001Temps de réponse : moy. 13.71s · total 233.06s · max 158.78s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.11sTemps de réponse (max)3.43sTemps de réponse (total)8.43s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.29sTemps de réponse (max)19.29sTemps de réponse (total)19.29s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.29sTemps de réponse (max)2.62sTemps de réponse (total)4.58s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.92sTemps de réponse (max)7.14sTemps de réponse (total)9.83s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.07sTemps de réponse (max)11.07sTemps de réponse (total)11.07s
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 72.6%Tests instables: 1…Jetons de sortie: 35,174Jetons de raisonnement: 24,687Temps de réponse : moy. 10.09s · total 90.85s · max 46.35s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.35sTemps de réponse (max)46.35sTemps de réponse (total)46.35s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.90sTemps de réponse (max)13.90sTemps de réponse (total)13.90s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.94sTemps de réponse (max)4.94sTemps de réponse (total)4.94s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.61sTemps de réponse (max)2.61sTemps de réponse (total)2.61s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.80sTemps de réponse (max)5.22sTemps de réponse (total)9.60s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.48sTemps de réponse (max)7.48sTemps de réponse (total)7.48s
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 76.5%Tests instables: 3…Jetons de sortie: 1,875Jetons de raisonnement: 26,959Temps de réponse : moy. 9.78s · total 156.45s · max 64.71s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.06sTemps de réponse (max)4.70sTemps de réponse (total)12.23s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)64.71sTemps de réponse (max)64.71sTemps de réponse (total)64.71s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)17.20sTemps de réponse (max)17.44sTemps de réponse (total)34.40s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)6.00sTemps de réponse (max)6.14sTemps de réponse (total)12.01s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.06sTemps de réponse (max)4.06sTemps de réponse (total)4.06s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.36sTemps de réponse (max)4.35sTemps de réponse (total)6.72s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.19sTemps de réponse (max)8.19sTemps de réponse (total)8.19s
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 82.4%Tests instables: 5…Jetons de sortie: 1,827Jetons de raisonnement: 179,299Temps de réponse : moy. 67.96s · total 1155.28s · max 234.29s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)59.11sTemps de réponse (max)168.31sTemps de réponse (total)236.44s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.78sTemps de réponse (max)17.78sTemps de réponse (total)17.78s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)56.99sTemps de réponse (max)80.14sTemps de réponse (total)113.98s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)146.50sTemps de réponse (max)234.29sTemps de réponse (total)439.49s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)40.05sTemps de réponse (max)40.05sTemps de réponse (total)40.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)63.49sTemps de réponse (max)111.61sTemps de réponse (total)126.98s
Résolution d'énigmes
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Temps de réponse (moy.)56.74sTemps de réponse (max)115.01sTemps de réponse (total)170.23s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.33sTemps de réponse (max)10.33sTemps de réponse (total)10.33s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5Temps de réponse (moy.)1.66sTemps de réponse (max)3.56sTemps de réponse (total)16.61s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 76.5%Tests instables: 2…Jetons de sortie: 1,417Jetons de raisonnement: 0Temps de réponse : moy. 1.66s · total 16.61s · max 3.56s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.25sTemps de réponse (max)1.59sTemps de réponse (total)2.49s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.56sTemps de réponse (max)3.56sTemps de réponse (total)3.56s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.41sTemps de réponse (max)1.41sTemps de réponse (total)1.41s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)963msTemps de réponse (max)963msTemps de réponse (total)963ms
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.13sTemps de réponse (max)1.13sTemps de réponse (total)1.13s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.58sTemps de réponse (max)1.58sTemps de réponse (total)1.58s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.06sTemps de réponse (max)1.06sTemps de réponse (total)2.12s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.35sTemps de réponse (max)3.35sTemps de réponse (total)3.35s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)3.28sTemps de réponse (max)11.91sTemps de réponse (total)55.80s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 70.6%Tests instables: 0…Jetons de sortie: 1,617Jetons de raisonnement: 7,686Temps de réponse : moy. 3.28s · total 55.80s · max 11.91s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.12sTemps de réponse (max)3.18sTemps de réponse (total)8.50s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)11.91sTemps de réponse (max)11.91sTemps de réponse (total)11.91s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.00sTemps de réponse (max)3.74sTemps de réponse (total)5.99s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.36sTemps de réponse (max)3.51sTemps de réponse (total)7.07s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.54sTemps de réponse (max)1.54sTemps de réponse (total)1.54s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.49sTemps de réponse (max)1.66sTemps de réponse (total)2.99s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.76sTemps de réponse (max)5.08sTemps de réponse (total)8.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.54sTemps de réponse (max)9.54sTemps de réponse (total)9.54s
Tests totaux: 17Tests incorrects: 6Taux de réussite par tentative: 76.5%Tests instables: 5…Jetons de sortie: 11,865Jetons de raisonnement: 35,632Temps de réponse : moy. 17.98s · total 305.72s · max 194.23s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.82sTemps de réponse (max)7.69sTemps de réponse (total)19.26s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.88sTemps de réponse (max)13.88sTemps de réponse (total)13.88s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.19sTemps de réponse (max)6.42sTemps de réponse (total)12.38s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)71.07sTemps de réponse (max)194.23sTemps de réponse (total)213.22s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)10.05sTemps de réponse (max)10.05sTemps de réponse (total)10.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.38sTemps de réponse (max)5.70sTemps de réponse (total)10.77s
Résolution d'énigmes
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)5.44sTemps de réponse (max)7.26sTemps de réponse (total)16.32s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.84sTemps de réponse (max)9.84sTemps de réponse (total)9.84s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)18.95sTemps de réponse (max)100.41sTemps de réponse (total)322.23s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 78.4%Tests instables: 3…Jetons de sortie: 1,780Jetons de raisonnement: 46,687Temps de réponse : moy. 18.95s · total 322.23s · max 100.41s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.11sTemps de réponse (max)6.42sTemps de réponse (total)16.42s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.57sTemps de réponse (max)20.57sTemps de réponse (total)20.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.32sTemps de réponse (max)5.40sTemps de réponse (total)10.64s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)74.27sTemps de réponse (max)100.41sTemps de réponse (total)222.80s
Intelligence générale
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.92sTemps de réponse (max)4.92sTemps de réponse (total)4.92s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.11sTemps de réponse (max)3.68sTemps de réponse (total)6.22s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)9.13sTemps de réponse (max)18.14sTemps de réponse (total)27.39s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.28sTemps de réponse (max)13.28sTemps de réponse (total)13.28s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)3.70sTemps de réponse (max)14.93sTemps de réponse (total)62.97s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 70.6%Tests instables: 0…Jetons de sortie: 1,737Jetons de raisonnement: 26,346Temps de réponse : moy. 3.70s · total 62.97s · max 14.93s
Astuces anti-IA
: 9.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.33sTemps de réponse (max)3.89sTemps de réponse (total)9.30s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.93sTemps de réponse (max)14.93sTemps de réponse (total)14.93s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.29sTemps de réponse (max)2.31sTemps de réponse (total)4.59s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)4.21sTemps de réponse (max)5.86sTemps de réponse (total)12.62s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.16sTemps de réponse (max)3.16sTemps de réponse (total)3.16s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.91sTemps de réponse (max)1.93sTemps de réponse (total)3.82s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.58sTemps de réponse (max)4.41sTemps de réponse (total)10.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.80sTemps de réponse (max)3.80sTemps de réponse (total)3.80s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)11.88sTemps de réponse (max)95.48sTemps de réponse (total)201.89s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 74.5%Tests instables: 1…Jetons de sortie: 1,376Jetons de raisonnement: 111,923Temps de réponse : moy. 11.88s · total 201.89s · max 95.48s
Astuces anti-IA
: 8.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.30sTemps de réponse (max)15.56sTemps de réponse (total)25.21s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)28.44sTemps de réponse (max)28.44sTemps de réponse (total)28.44s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.06sTemps de réponse (max)5.06sTemps de réponse (total)8.11s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)37.34sTemps de réponse (max)95.48sTemps de réponse (total)112.01s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.86sTemps de réponse (max)4.86sTemps de réponse (total)4.86s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.62sTemps de réponse (max)2.78sTemps de réponse (total)5.24s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.94sTemps de réponse (max)6.33sTemps de réponse (total)11.83s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.20sTemps de réponse (max)6.20sTemps de réponse (total)6.20s
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 80.4%Tests instables: 3…Jetons de sortie: 9,994Jetons de raisonnement: 41,719Temps de réponse : moy. 38.49s · total 654.41s · max 93.11s
Astuces anti-IA
: 8.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)30.72sTemps de réponse (max)44.23sTemps de réponse (total)122.88s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)93.11sTemps de réponse (max)93.11sTemps de réponse (total)93.11s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)36.09sTemps de réponse (max)39.12sTemps de réponse (total)72.18s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)39.32sTemps de réponse (max)79.03sTemps de réponse (total)117.95s
Intelligence générale
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)31.30sTemps de réponse (max)31.30sTemps de réponse (total)31.30s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)35.78sTemps de réponse (max)47.30sTemps de réponse (total)71.56s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)36.87sTemps de réponse (max)59.22sTemps de réponse (total)110.62s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.81sTemps de réponse (max)34.81sTemps de réponse (total)34.81s
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 84.3%Tests instables: 4…Jetons de sortie: 19,833Jetons de raisonnement: 38,523Temps de réponse : moy. 17.15s · total 154.32s · max 28.96s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.66sTemps de réponse (max)25.06sTemps de réponse (total)47.32s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)28.96sTemps de réponse (max)28.96sTemps de réponse (total)28.96s
Analyse et extraction des données
: 7.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)8.90sTemps de réponse (max)8.90sTemps de réponse (total)8.90s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)14.69sTemps de réponse (max)14.69sTemps de réponse (total)14.69s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.25sTemps de réponse (max)7.25sTemps de réponse (total)7.25s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.64sTemps de réponse (max)16.34sTemps de réponse (total)31.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.93sTemps de réponse (max)15.93sTemps de réponse (total)15.93s
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 80.4%Tests instables: 3…Jetons de sortie: 2,125Jetons de raisonnement: 223,335Temps de réponse : moy. 52.01s · total 884.10s · max 163.96s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)19.75sTemps de réponse (max)49.95sTemps de réponse (total)79.01s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)163.96sTemps de réponse (max)163.96sTemps de réponse (total)163.96s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)30.26sTemps de réponse (max)32.03sTemps de réponse (total)60.52s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)79.53sTemps de réponse (max)95.52sTemps de réponse (total)238.59s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)101.41sTemps de réponse (max)101.41sTemps de réponse (total)101.41s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.66sTemps de réponse (max)32.25sTemps de réponse (total)39.32s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)64.61sTemps de réponse (max)123.57sTemps de réponse (total)193.84s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.45sTemps de réponse (max)7.45sTemps de réponse (total)7.45s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Délai dépassé: 1Temps de réponse (moy.)29.05sTemps de réponse (max)119.29sTemps de réponse (total)493.86s…
Tests totaux: 17Tests incorrects: 4Taux de réussite par tentative: 80.4%Tests instables: 2…Jetons de sortie: 17,313Jetons de raisonnement: 151,974Temps de réponse : moy. 29.05s · total 493.86s · max 119.29s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.75sTemps de réponse (max)18.03sTemps de réponse (total)39.01s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)107.79sTemps de réponse (max)107.79sTemps de réponse (total)107.79s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.41sTemps de réponse (max)29.79sTemps de réponse (total)46.83s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)63.40sTemps de réponse (max)119.29sTemps de réponse (total)190.20s
Intelligence générale
: 3.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)34.11sTemps de réponse (max)34.11sTemps de réponse (total)34.11s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.88sTemps de réponse (max)15.44sTemps de réponse (total)19.76s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.18sTemps de réponse (max)31.99sTemps de réponse (total)51.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.60sTemps de réponse (max)4.60sTemps de réponse (total)4.60s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Mauvaise réponse: 2Temps de réponse (moy.)39.13sTemps de réponse (max)81.20sTemps de réponse (total)391.29s…
Tests totaux: 17Tests incorrects: 4Taux de réussite par tentative: 82.4%Tests instables: 2…Jetons de sortie: 1,754Jetons de raisonnement: 92,522Temps de réponse : moy. 39.13s · total 391.29s · max 81.20s
Astuces anti-IA
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)45.78sTemps de réponse (max)81.20sTemps de réponse (total)91.57s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.85sTemps de réponse (max)46.85sTemps de réponse (total)46.85s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.91sTemps de réponse (max)46.91sTemps de réponse (total)46.91s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)17.50sTemps de réponse (max)17.50sTemps de réponse (total)17.50s
Intelligence générale
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)79.86sTemps de réponse (max)79.86sTemps de réponse (total)79.86s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.93sTemps de réponse (max)31.93sTemps de réponse (total)31.93s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.57sTemps de réponse (max)49.12sTemps de réponse (total)69.13s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.54sTemps de réponse (max)7.54sTemps de réponse (total)7.54s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 1Temps de réponse (moy.)68.83sTemps de réponse (max)280.52sTemps de réponse (total)1101.32s…
Tests totaux: 16Tests incorrects: 4Taux de réussite par tentative: 77.1%Tests instables: 1…Jetons de sortie: 1,283Jetons de raisonnement: 1,533,310Temps de réponse : moy. 68.83s · total 1101.32s · max 280.52s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)43.87sTemps de réponse (max)121.88sTemps de réponse (total)131.62s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)280.52sTemps de réponse (max)280.52sTemps de réponse (total)280.52s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.16sTemps de réponse (max)8.54sTemps de réponse (total)14.31s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)127.58sTemps de réponse (max)133.93sTemps de réponse (total)382.74s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.25sTemps de réponse (max)5.25sTemps de réponse (total)5.25s
Suivi des instructions
: 7.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)70.07sTemps de réponse (max)136.53sTemps de réponse (total)140.14s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)46.33sTemps de réponse (max)134.22sTemps de réponse (total)139.00s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.73sTemps de réponse (max)7.73sTemps de réponse (total)7.73s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)15.76sTemps de réponse (max)100.93sTemps de réponse (total)267.97s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 82.4%Tests instables: 3…Jetons de sortie: 1,788Jetons de raisonnement: 33,649Temps de réponse : moy. 15.76s · total 267.97s · max 100.93s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.16sTemps de réponse (max)6.68sTemps de réponse (total)16.63s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.56sTemps de réponse (max)19.56sTemps de réponse (total)19.56s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.07sTemps de réponse (max)3.59sTemps de réponse (total)6.15s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)64.31sTemps de réponse (max)100.93sTemps de réponse (total)192.94s
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.87sTemps de réponse (max)4.87sTemps de réponse (total)4.87s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.04sTemps de réponse (max)3.44sTemps de réponse (total)6.07s
Résolution d'énigmes
: 9.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.12sTemps de réponse (max)8.73sTemps de réponse (total)15.37s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.37sTemps de réponse (max)6.37sTemps de réponse (total)6.37s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 1Temps de réponse (moy.)13.94sTemps de réponse (max)43.55sTemps de réponse (total)237.01s…
Tests totaux: 17Tests incorrects: 4Taux de réussite par tentative: 76.5%Tests instables: 0…Jetons de sortie: 1,756Jetons de raisonnement: 77,213Temps de réponse : moy. 13.94s · total 237.01s · max 43.55s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.90sTemps de réponse (max)19.37sTemps de réponse (total)39.60s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.95sTemps de réponse (max)34.95sTemps de réponse (total)34.95s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.95sTemps de réponse (max)15.40sTemps de réponse (total)29.90s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)22.08sTemps de réponse (max)43.55sTemps de réponse (total)66.23s
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)27.05sTemps de réponse (max)27.05sTemps de réponse (total)27.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.54sTemps de réponse (max)11.67sTemps de réponse (total)15.07s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.11sTemps de réponse (max)7.52sTemps de réponse (total)18.34s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.87sTemps de réponse (max)5.87sTemps de réponse (total)5.87s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)27.78sTemps de réponse (max)168.71sTemps de réponse (total)472.24s…
Tests totaux: 17Tests incorrects: 5Taux de réussite par tentative: 82.4%Tests instables: 3…Jetons de sortie: 2,821Jetons de raisonnement: 44,723Temps de réponse : moy. 27.78s · total 472.24s · max 168.71s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)17.99sTemps de réponse (max)48.33sTemps de réponse (total)71.98s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)37.67sTemps de réponse (max)37.67sTemps de réponse (total)37.67s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.07sTemps de réponse (max)12.19sTemps de réponse (total)18.14s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)88.74sTemps de réponse (max)168.71sTemps de réponse (total)266.21s
Intelligence générale
: 6.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)18.25sTemps de réponse (max)18.25sTemps de réponse (total)18.25s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.26sTemps de réponse (max)9.02sTemps de réponse (total)14.52s
Résolution d'énigmes
: 9.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)11.03sTemps de réponse (max)13.85sTemps de réponse (total)33.09s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.38sTemps de réponse (max)12.38sTemps de réponse (total)12.38s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)9.06sTemps de réponse (max)26.24sTemps de réponse (total)90.58s…
Tests totaux: 17Tests incorrects: 3Taux de réussite par tentative: 82.4%Tests instables: 0…Jetons de sortie: 1,508Jetons de raisonnement: 10,084Temps de réponse : moy. 9.06s · total 90.58s · max 26.24s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.99sTemps de réponse (max)26.24sTemps de réponse (total)29.99s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)10.37sTemps de réponse (max)10.37sTemps de réponse (total)10.37s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.84sTemps de réponse (max)10.84sTemps de réponse (total)10.84s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)7.01sTemps de réponse (max)7.01sTemps de réponse (total)7.01s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.34sTemps de réponse (max)9.34sTemps de réponse (total)9.34s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.26sTemps de réponse (max)3.26sTemps de réponse (total)3.26s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.91sTemps de réponse (max)4.23sTemps de réponse (total)7.81s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.96sTemps de réponse (max)11.96sTemps de réponse (total)11.96s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)5.95sTemps de réponse (max)14.72sTemps de réponse (total)101.19s…
Tests totaux: 17Tests incorrects: 3Taux de réussite par tentative: 84.3%Tests instables: 1…Jetons de sortie: 1,592Jetons de raisonnement: 20,556Temps de réponse : moy. 5.95s · total 101.19s · max 14.72s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.48sTemps de réponse (max)4.31sTemps de réponse (total)13.94s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.27sTemps de réponse (max)3.27sTemps de réponse (total)3.27s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.40sTemps de réponse (max)14.72sTemps de réponse (total)18.80s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)8.05sTemps de réponse (max)14.40sTemps de réponse (total)24.15s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.68sTemps de réponse (max)3.68sTemps de réponse (total)3.68s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.02sTemps de réponse (max)7.35sTemps de réponse (total)14.03s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.11sTemps de réponse (max)10.27sTemps de réponse (total)18.32s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.99sTemps de réponse (max)4.99sTemps de réponse (total)4.99s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)15.56sTemps de réponse (max)40.61sTemps de réponse (total)155.64s…
Tests totaux: 17Tests incorrects: 1Taux de réussite par tentative: 94.1%Tests instables: 0…Jetons de sortie: 1,527Jetons de raisonnement: 36,341Temps de réponse : moy. 15.56s · total 155.64s · max 40.61s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.90sTemps de réponse (max)9.52sTemps de réponse (total)15.80s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)40.61sTemps de réponse (max)40.61sTemps de réponse (total)40.61s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.72sTemps de réponse (max)7.72sTemps de réponse (total)7.72s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)32.73sTemps de réponse (max)32.73sTemps de réponse (total)32.73s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.77sTemps de réponse (max)11.77sTemps de réponse (total)11.77s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.56sTemps de réponse (max)9.56sTemps de réponse (total)9.56s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.15sTemps de réponse (max)8.49sTemps de réponse (total)14.30s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.15sTemps de réponse (max)23.15sTemps de réponse (total)23.15s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.39sTemps de réponse (max)50.16sTemps de réponse (total)113.86s…
Tests totaux: 17Tests incorrects: 0Taux de réussite par tentative: 100.0%Tests instables: 0…Jetons de sortie: 1,640Jetons de raisonnement: 48,270Temps de réponse : moy. 11.39s · total 113.86s · max 50.16s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.13sTemps de réponse (max)5.61sTemps de réponse (total)8.26s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)50.16sTemps de réponse (max)50.16sTemps de réponse (total)50.16s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.72sTemps de réponse (max)4.72sTemps de réponse (total)4.72s
Spécifique au domaine
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)21.12sTemps de réponse (max)21.12sTemps de réponse (total)21.12s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.09sTemps de réponse (max)4.09sTemps de réponse (total)4.09s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.10sTemps de réponse (max)6.10sTemps de réponse (total)6.10s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.43sTemps de réponse (max)4.68sTemps de réponse (total)8.85s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.55sTemps de réponse (max)10.55sTemps de réponse (total)10.55s