Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.11sTemps de réponse (max)82.37sTemps de réponse (total)217.93s…
Tests totaux: 18Tests incorrects: 0Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 100.0%Tests instables: 0…Jetons de sortie: 655Jetons de raisonnement: 33,749Temps de réponse : moy. 12.11s · total 217.93s · max 82.37s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.26sTemps de réponse (max)5.01sTemps de réponse (total)13.04s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)82.37sTemps de réponse (max)82.37sTemps de réponse (total)82.37s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.58sTemps de réponse (max)23.58sTemps de réponse (total)23.58s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.62sTemps de réponse (max)8.37sTemps de réponse (total)15.24s
Spécifique au domaine
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.81sTemps de réponse (max)32.44sTemps de réponse (total)44.43s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.34sTemps de réponse (max)6.34sTemps de réponse (total)6.34s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.30sTemps de réponse (max)5.19sTemps de réponse (total)8.59s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.86sTemps de réponse (max)7.59sTemps de réponse (total)14.57s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.78sTemps de réponse (max)9.78sTemps de réponse (total)9.78s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)15.96sTemps de réponse (max)40.61sTemps de réponse (total)175.52s…
Tests totaux: 18Tests incorrects: 1Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 94.4%Tests instables: 0…Jetons de sortie: 1,932Jetons de raisonnement: 40,542Temps de réponse : moy. 15.96s · total 175.52s · max 40.61s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.90sTemps de réponse (max)9.52sTemps de réponse (total)15.80s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.88sTemps de réponse (max)19.88sTemps de réponse (total)19.88s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)40.61sTemps de réponse (max)40.61sTemps de réponse (total)40.61s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.72sTemps de réponse (max)7.72sTemps de réponse (total)7.72s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)32.73sTemps de réponse (max)32.73sTemps de réponse (total)32.73s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.77sTemps de réponse (max)11.77sTemps de réponse (total)11.77s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.56sTemps de réponse (max)9.56sTemps de réponse (total)9.56s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.15sTemps de réponse (max)8.49sTemps de réponse (total)14.30s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.15sTemps de réponse (max)23.15sTemps de réponse (total)23.15s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)3.53sTemps de réponse (max)21.45sTemps de réponse (total)60.03s…
Tests totaux: 18Tests incorrects: 2Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 88.9%Tests instables: 0…Jetons de sortie: 5,375Jetons de raisonnement: 1,341Temps de réponse : moy. 3.53s · total 60.03s · max 21.45s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.85sTemps de réponse (max)2.71sTemps de réponse (total)7.38s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.41sTemps de réponse (max)6.41sTemps de réponse (total)6.41s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)21.45sTemps de réponse (max)21.45sTemps de réponse (total)21.45s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.37sTemps de réponse (max)3.30sTemps de réponse (total)4.74s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)1.17sTemps de réponse (max)1.40sTemps de réponse (total)2.35s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.87sTemps de réponse (max)2.87sTemps de réponse (total)2.87s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.57sTemps de réponse (max)1.66sTemps de réponse (total)3.14s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.51sTemps de réponse (max)2.89sTemps de réponse (total)7.54s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.17sTemps de réponse (max)4.17sTemps de réponse (total)4.17s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)3.13sTemps de réponse (max)18.27sTemps de réponse (total)56.33s…
Tests totaux: 18Tests incorrects: 2Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 88.9%Tests instables: 0…Jetons de sortie: 6,326Jetons de raisonnement: 0Temps de réponse : moy. 3.13s · total 56.33s · max 18.27s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.12sTemps de réponse (max)3.75sTemps de réponse (total)8.50s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.84sTemps de réponse (max)2.84sTemps de réponse (total)2.84s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)18.27sTemps de réponse (max)18.27sTemps de réponse (total)18.27s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.15sTemps de réponse (max)2.33sTemps de réponse (total)4.29s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.19sTemps de réponse (max)1.40sTemps de réponse (total)3.58s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.47sTemps de réponse (max)3.47sTemps de réponse (total)3.47s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.46sTemps de réponse (max)1.68sTemps de réponse (total)2.91s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.58sTemps de réponse (max)4.07sTemps de réponse (total)7.73s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.74sTemps de réponse (max)4.74sTemps de réponse (total)4.74s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2N'a pas suivi les instructions: 1Temps de réponse (moy.)32.75sTemps de réponse (max)332.10sTemps de réponse (total)589.59s…
Tests totaux: 18Tests incorrects: 3Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 87.0%Tests instables: 2…Jetons de sortie: 1,920Jetons de raisonnement: 89,632Temps de réponse : moy. 32.75s · total 589.59s · max 332.10s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.66sTemps de réponse (max)6.74sTemps de réponse (total)18.65s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.09sTemps de réponse (max)9.09sTemps de réponse (total)9.09s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.29sTemps de réponse (max)19.29sTemps de réponse (total)19.29s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.18sTemps de réponse (max)4.35sTemps de réponse (total)8.36s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)164.14sTemps de réponse (max)332.10sTemps de réponse (total)492.41s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.16sTemps de réponse (max)4.16sTemps de réponse (total)4.16s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.36sTemps de réponse (max)3.46sTemps de réponse (total)6.73s
Résolution d'énigmes
: 8.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.78sTemps de réponse (max)10.54sTemps de réponse (total)20.33s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.57sTemps de réponse (max)10.57sTemps de réponse (total)10.57s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)6.01sTemps de réponse (max)14.72sTemps de réponse (total)108.12s…
Tests totaux: 18Tests incorrects: 3Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 85.2%Tests instables: 1…Jetons de sortie: 2,018Jetons de raisonnement: 23,273Temps de réponse : moy. 6.01s · total 108.12s · max 14.72s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.48sTemps de réponse (max)4.31sTemps de réponse (total)13.94s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.94sTemps de réponse (max)6.94sTemps de réponse (total)6.94s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.27sTemps de réponse (max)3.27sTemps de réponse (total)3.27s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.40sTemps de réponse (max)14.72sTemps de réponse (total)18.80s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)8.05sTemps de réponse (max)14.40sTemps de réponse (total)24.15s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.68sTemps de réponse (max)3.68sTemps de réponse (total)3.68s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.02sTemps de réponse (max)7.35sTemps de réponse (total)14.03s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.11sTemps de réponse (max)10.27sTemps de réponse (total)18.32s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.99sTemps de réponse (max)4.99sTemps de réponse (total)4.99s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)30.37sTemps de réponse (max)168.71sTemps de réponse (total)546.72s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 83.3%Tests instables: 3…Jetons de sortie: 3,257Jetons de raisonnement: 52,042Temps de réponse : moy. 30.37s · total 546.72s · max 168.71s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)17.99sTemps de réponse (max)48.33sTemps de réponse (total)71.98s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)74.49sTemps de réponse (max)74.49sTemps de réponse (total)74.49s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)37.67sTemps de réponse (max)37.67sTemps de réponse (total)37.67s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.07sTemps de réponse (max)12.19sTemps de réponse (total)18.14s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)88.74sTemps de réponse (max)168.71sTemps de réponse (total)266.21s
Intelligence générale
: 6.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)18.25sTemps de réponse (max)18.25sTemps de réponse (total)18.25s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.26sTemps de réponse (max)9.02sTemps de réponse (total)14.52s
Résolution d'énigmes
: 9.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)11.03sTemps de réponse (max)13.85sTemps de réponse (total)33.09s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.38sTemps de réponse (max)12.38sTemps de réponse (total)12.38s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)15.38sTemps de réponse (max)100.93sTemps de réponse (total)276.91s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 83.3%Tests instables: 3…Jetons de sortie: 2,279Jetons de raisonnement: 35,179Temps de réponse : moy. 15.38s · total 276.91s · max 100.93s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.16sTemps de réponse (max)6.68sTemps de réponse (total)16.63s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.95sTemps de réponse (max)8.95sTemps de réponse (total)8.95s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.56sTemps de réponse (max)19.56sTemps de réponse (total)19.56s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.07sTemps de réponse (max)3.59sTemps de réponse (total)6.15s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)64.31sTemps de réponse (max)100.93sTemps de réponse (total)192.94s
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.87sTemps de réponse (max)4.87sTemps de réponse (total)4.87s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.04sTemps de réponse (max)3.44sTemps de réponse (total)6.07s
Résolution d'énigmes
: 9.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.12sTemps de réponse (max)8.73sTemps de réponse (total)15.37s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.37sTemps de réponse (max)6.37sTemps de réponse (total)6.37s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Mauvaise réponse: 2Temps de réponse (moy.)46.56sTemps de réponse (max)120.91sTemps de réponse (total)512.20s…
Tests totaux: 18Tests incorrects: 4Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 83.3%Tests instables: 2…Jetons de sortie: 2,121Jetons de raisonnement: 111,889Temps de réponse : moy. 46.56s · total 512.20s · max 120.91s
Astuces anti-IA
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)45.78sTemps de réponse (max)81.20sTemps de réponse (total)91.57s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)120.91sTemps de réponse (max)120.91sTemps de réponse (total)120.91s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.85sTemps de réponse (max)46.85sTemps de réponse (total)46.85s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.91sTemps de réponse (max)46.91sTemps de réponse (total)46.91s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)17.50sTemps de réponse (max)17.50sTemps de réponse (total)17.50s
Intelligence générale
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)79.86sTemps de réponse (max)79.86sTemps de réponse (total)79.86s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.93sTemps de réponse (max)31.93sTemps de réponse (total)31.93s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.57sTemps de réponse (max)49.12sTemps de réponse (total)69.13s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.54sTemps de réponse (max)7.54sTemps de réponse (total)7.54s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 81.5%Tests instables: 3…Jetons de sortie: 238,920Jetons de raisonnement: 0Temps de réponse : moy. 55.19s · total 938.23s · max 149.94s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)32.69sTemps de réponse (max)85.41sTemps de réponse (total)130.78s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)99.76sTemps de réponse (max)99.76sTemps de réponse (total)99.76s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)113.09sTemps de réponse (max)113.09sTemps de réponse (total)113.09s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)12.11sTemps de réponse (max)12.11sTemps de réponse (total)12.11s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)109.04sTemps de réponse (max)149.94sTemps de réponse (total)327.11s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.31sTemps de réponse (max)24.31sTemps de réponse (total)24.31s
Suivi des instructions
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)34.02sTemps de réponse (max)41.83sTemps de réponse (total)68.04s
Résolution d'énigmes
: 9.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)28.07sTemps de réponse (max)45.06sTemps de réponse (total)84.21s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)78.83sTemps de réponse (max)78.83sTemps de réponse (total)78.83s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 1Temps de réponse (moy.)13.94sTemps de réponse (max)43.55sTemps de réponse (total)237.01s…
Tests totaux: 17Tests incorrects: 4Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 76.5%Tests instables: 0…Jetons de sortie: 1,756Jetons de raisonnement: 77,213Temps de réponse : moy. 13.94s · total 237.01s · max 43.55s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.90sTemps de réponse (max)19.37sTemps de réponse (total)39.60s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.95sTemps de réponse (max)34.95sTemps de réponse (total)34.95s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.95sTemps de réponse (max)15.40sTemps de réponse (total)29.90s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)22.08sTemps de réponse (max)43.55sTemps de réponse (total)66.23s
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)27.05sTemps de réponse (max)27.05sTemps de réponse (total)27.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.54sTemps de réponse (max)11.67sTemps de réponse (total)15.07s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.11sTemps de réponse (max)7.52sTemps de réponse (total)18.34s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.87sTemps de réponse (max)5.87sTemps de réponse (total)5.87s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 81.5%Tests instables: 3…Jetons de sortie: 2,500Jetons de raisonnement: 242,500Temps de réponse : moy. 53.03s · total 954.46s · max 163.96s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)19.75sTemps de réponse (max)49.95sTemps de réponse (total)79.01s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)70.35sTemps de réponse (max)70.35sTemps de réponse (total)70.35s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)163.96sTemps de réponse (max)163.96sTemps de réponse (total)163.96s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)30.26sTemps de réponse (max)32.03sTemps de réponse (total)60.52s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)79.53sTemps de réponse (max)95.52sTemps de réponse (total)238.59s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)101.41sTemps de réponse (max)101.41sTemps de réponse (total)101.41s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.66sTemps de réponse (max)32.25sTemps de réponse (total)39.32s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)64.61sTemps de réponse (max)123.57sTemps de réponse (total)193.84s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.45sTemps de réponse (max)7.45sTemps de réponse (total)7.45s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 1Temps de réponse (moy.)68.83sTemps de réponse (max)280.52sTemps de réponse (total)1101.32s…
Tests totaux: 16Tests incorrects: 4Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.1%Tests instables: 1…Jetons de sortie: 1,283Jetons de raisonnement: 1,533,310Temps de réponse : moy. 68.83s · total 1101.32s · max 280.52s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)43.87sTemps de réponse (max)121.88sTemps de réponse (total)131.62s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)280.52sTemps de réponse (max)280.52sTemps de réponse (total)280.52s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.16sTemps de réponse (max)8.54sTemps de réponse (total)14.31s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)127.58sTemps de réponse (max)133.93sTemps de réponse (total)382.74s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.25sTemps de réponse (max)5.25sTemps de réponse (total)5.25s
Suivi des instructions
: 7.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)70.07sTemps de réponse (max)136.53sTemps de réponse (total)140.14s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)46.33sTemps de réponse (max)134.22sTemps de réponse (total)139.00s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.73sTemps de réponse (max)7.73sTemps de réponse (total)7.73s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Erreur API: 1Temps de réponse (moy.)9.06sTemps de réponse (max)26.24sTemps de réponse (total)90.58s…
Tests totaux: 18Tests incorrects: 4Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.8%Tests instables: 0…Jetons de sortie: 1,508Jetons de raisonnement: 10,084Temps de réponse : moy. 9.06s · total 90.58s · max 26.24s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.99sTemps de réponse (max)26.24sTemps de réponse (total)29.99s
Programmation
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)10.37sTemps de réponse (max)10.37sTemps de réponse (total)10.37s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.84sTemps de réponse (max)10.84sTemps de réponse (total)10.84s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)7.01sTemps de réponse (max)7.01sTemps de réponse (total)7.01s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.34sTemps de réponse (max)9.34sTemps de réponse (total)9.34s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.26sTemps de réponse (max)3.26sTemps de réponse (total)3.26s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.91sTemps de réponse (max)4.23sTemps de réponse (total)7.81s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.96sTemps de réponse (max)11.96sTemps de réponse (total)11.96s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 85.2%Tests instables: 4…Jetons de sortie: 20,163Jetons de raisonnement: 58,337Temps de réponse : moy. 23.34s · total 233.40s · max 79.09s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.66sTemps de réponse (max)25.06sTemps de réponse (total)47.32s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)79.09sTemps de réponse (max)79.09sTemps de réponse (total)79.09s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)28.96sTemps de réponse (max)28.96sTemps de réponse (total)28.96s
Analyse et extraction des données
: 7.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)8.90sTemps de réponse (max)8.90sTemps de réponse (total)8.90s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)14.69sTemps de réponse (max)14.69sTemps de réponse (total)14.69s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.25sTemps de réponse (max)7.25sTemps de réponse (total)7.25s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.64sTemps de réponse (max)16.34sTemps de réponse (total)31.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.93sTemps de réponse (max)15.93sTemps de réponse (total)15.93s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 79.6%Tests instables: 2…Jetons de sortie: 12,734Jetons de raisonnement: 27,950Temps de réponse : moy. 24.88s · total 398.13s · max 70.97s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.89sTemps de réponse (max)26.66sTemps de réponse (total)51.55s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)70.97sTemps de réponse (max)70.97sTemps de réponse (total)70.97s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)21.11sTemps de réponse (max)21.94sTemps de réponse (total)42.21s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)38.48sTemps de réponse (max)68.92sTemps de réponse (total)115.43s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.57sTemps de réponse (max)9.57sTemps de réponse (total)9.57s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.76sTemps de réponse (max)17.53sTemps de réponse (total)25.52s
Résolution d'énigmes
: 8.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)27.63sTemps de réponse (max)61.08sTemps de réponse (total)82.89s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)12.12sTemps de réponse (max)95.48sTemps de réponse (total)218.12s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 1…Jetons de sortie: 1,898Jetons de raisonnement: 122,273Temps de réponse : moy. 12.12s · total 218.12s · max 95.48s
Astuces anti-IA
: 8.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)6.30sTemps de réponse (max)15.56sTemps de réponse (total)25.21s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.23sTemps de réponse (max)16.23sTemps de réponse (total)16.23s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)28.44sTemps de réponse (max)28.44sTemps de réponse (total)28.44s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.06sTemps de réponse (max)5.06sTemps de réponse (total)8.11s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)37.34sTemps de réponse (max)95.48sTemps de réponse (total)112.01s
Intelligence générale
: 4.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.86sTemps de réponse (max)4.86sTemps de réponse (total)4.86s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.62sTemps de réponse (max)2.78sTemps de réponse (total)5.24s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.94sTemps de réponse (max)6.33sTemps de réponse (total)11.83s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.20sTemps de réponse (max)6.20sTemps de réponse (total)6.20s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)18.63sTemps de réponse (max)100.41sTemps de réponse (total)335.26s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 79.6%Tests instables: 3…Jetons de sortie: 2,169Jetons de raisonnement: 48,732Temps de réponse : moy. 18.63s · total 335.26s · max 100.41s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.11sTemps de réponse (max)6.42sTemps de réponse (total)16.42s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.03sTemps de réponse (max)13.03sTemps de réponse (total)13.03s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.57sTemps de réponse (max)20.57sTemps de réponse (total)20.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.32sTemps de réponse (max)5.40sTemps de réponse (total)10.64s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)74.27sTemps de réponse (max)100.41sTemps de réponse (total)222.80s
Intelligence générale
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.92sTemps de réponse (max)4.92sTemps de réponse (total)4.92s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.11sTemps de réponse (max)3.68sTemps de réponse (total)6.22s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)9.13sTemps de réponse (max)18.14sTemps de réponse (total)27.39s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.28sTemps de réponse (max)13.28sTemps de réponse (total)13.28s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)3.74sTemps de réponse (max)14.93sTemps de réponse (total)67.31s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 72.2%Tests instables: 0…Jetons de sortie: 2,168Jetons de raisonnement: 29,030Temps de réponse : moy. 3.74s · total 67.31s · max 14.93s
Astuces anti-IA
: 9.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.33sTemps de réponse (max)3.89sTemps de réponse (total)9.30s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.34sTemps de réponse (max)4.34sTemps de réponse (total)4.34s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.93sTemps de réponse (max)14.93sTemps de réponse (total)14.93s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.29sTemps de réponse (max)2.31sTemps de réponse (total)4.59s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)4.21sTemps de réponse (max)5.86sTemps de réponse (total)12.62s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.16sTemps de réponse (max)3.16sTemps de réponse (total)3.16s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.91sTemps de réponse (max)1.93sTemps de réponse (total)3.82s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.58sTemps de réponse (max)4.41sTemps de réponse (total)10.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.80sTemps de réponse (max)3.80sTemps de réponse (total)3.80s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3N'a pas suivi les instructions: 2Temps de réponse (moy.)71.21sTemps de réponse (max)351.99sTemps de réponse (total)1281.73s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 1…Jetons de sortie: 671Jetons de raisonnement: 39,383Temps de réponse : moy. 71.21s · total 1281.73s · max 351.99s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)26.93sTemps de réponse (max)61.35sTemps de réponse (total)107.71s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)93.00sTemps de réponse (max)93.00sTemps de réponse (total)93.00s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)71.08sTemps de réponse (max)71.08sTemps de réponse (total)71.08s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)63.00sTemps de réponse (max)102.80sTemps de réponse (total)126.00s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)202.56sTemps de réponse (max)351.99sTemps de réponse (total)607.68s
Intelligence générale
: 5.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)26.96sTemps de réponse (max)26.96sTemps de réponse (total)26.96s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.60sTemps de réponse (max)20.03sTemps de réponse (total)29.20s
Résolution d'énigmes
: 7.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)69.69sTemps de réponse (max)92.65sTemps de réponse (total)209.06s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.05sTemps de réponse (max)11.05sTemps de réponse (total)11.05s
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.8%Tests instables: 5…Jetons de sortie: 12,197Jetons de raisonnement: 38,933Temps de réponse : moy. 17.67s · total 317.98s · max 194.23s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.82sTemps de réponse (max)7.69sTemps de réponse (total)19.26s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.26sTemps de réponse (max)12.26sTemps de réponse (total)12.26s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.88sTemps de réponse (max)13.88sTemps de réponse (total)13.88s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.19sTemps de réponse (max)6.42sTemps de réponse (total)12.38s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)71.07sTemps de réponse (max)194.23sTemps de réponse (total)213.22s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)10.05sTemps de réponse (max)10.05sTemps de réponse (total)10.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.38sTemps de réponse (max)5.70sTemps de réponse (total)10.77s
Résolution d'énigmes
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)5.44sTemps de réponse (max)7.26sTemps de réponse (total)16.32s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.84sTemps de réponse (max)9.84sTemps de réponse (total)9.84s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Délai dépassé: 2Temps de réponse (moy.)31.38sTemps de réponse (max)119.29sTemps de réponse (total)564.84s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 79.6%Tests instables: 3…Jetons de sortie: 17,635Jetons de raisonnement: 162,668Temps de réponse : moy. 31.38s · total 564.84s · max 119.29s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.75sTemps de réponse (max)18.03sTemps de réponse (total)39.01s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)70.98sTemps de réponse (max)70.98sTemps de réponse (total)70.98s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)107.79sTemps de réponse (max)107.79sTemps de réponse (total)107.79s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.41sTemps de réponse (max)29.79sTemps de réponse (total)46.83s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)63.40sTemps de réponse (max)119.29sTemps de réponse (total)190.20s
Intelligence générale
: 3.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)34.11sTemps de réponse (max)34.11sTemps de réponse (total)34.11s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.88sTemps de réponse (max)15.44sTemps de réponse (total)19.76s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.18sTemps de réponse (max)31.99sTemps de réponse (total)51.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.60sTemps de réponse (max)4.60sTemps de réponse (total)4.60s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 1…Jetons de sortie: 1,763Jetons de raisonnement: 83,782Temps de réponse : moy. 15.27s · total 259.55s · max 43.55s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.90sTemps de réponse (max)19.37sTemps de réponse (total)39.60s
Programmation
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.95sTemps de réponse (max)34.95sTemps de réponse (total)34.95s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.95sTemps de réponse (max)15.40sTemps de réponse (total)29.90s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)29.59sTemps de réponse (max)43.55sTemps de réponse (total)88.77s
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)27.05sTemps de réponse (max)27.05sTemps de réponse (total)27.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.54sTemps de réponse (max)11.67sTemps de réponse (total)15.07s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.11sTemps de réponse (max)7.52sTemps de réponse (total)18.34s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.87sTemps de réponse (max)5.87sTemps de réponse (total)5.87s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 1…Jetons de sortie: 65,778Jetons de raisonnement: 0Temps de réponse : moy. 23.98s · total 407.72s · max 78.74s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.61sTemps de réponse (max)38.50sTemps de réponse (total)66.46s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)27.94sTemps de réponse (max)27.94sTemps de réponse (total)27.94s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)78.74sTemps de réponse (max)78.74sTemps de réponse (total)78.74s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)5.85sTemps de réponse (max)5.85sTemps de réponse (total)5.85s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)40.44sTemps de réponse (max)46.32sTemps de réponse (total)121.31s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.44sTemps de réponse (max)16.44sTemps de réponse (total)16.44s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.98sTemps de réponse (max)22.24sTemps de réponse (total)31.97s
Résolution d'énigmes
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)13.73sTemps de réponse (max)25.82sTemps de réponse (total)41.19s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.84sTemps de réponse (max)17.84sTemps de réponse (total)17.84s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5Temps de réponse (moy.)1.65sTemps de réponse (max)3.56sTemps de réponse (total)18.20s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.8%Tests instables: 2…Jetons de sortie: 1,840Jetons de raisonnement: 0Temps de réponse : moy. 1.65s · total 18.20s · max 3.56s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.25sTemps de réponse (max)1.59sTemps de réponse (total)2.49s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.59sTemps de réponse (max)1.59sTemps de réponse (total)1.59s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.56sTemps de réponse (max)3.56sTemps de réponse (total)3.56s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.41sTemps de réponse (max)1.41sTemps de réponse (total)1.41s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)963msTemps de réponse (max)963msTemps de réponse (total)963ms
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.13sTemps de réponse (max)1.13sTemps de réponse (total)1.13s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.58sTemps de réponse (max)1.58sTemps de réponse (total)1.58s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.06sTemps de réponse (max)1.06sTemps de réponse (total)2.12s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.35sTemps de réponse (max)3.35sTemps de réponse (total)3.35s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 1Temps de réponse (moy.)3.22sTemps de réponse (max)11.91sTemps de réponse (total)58.00s…
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 72.2%Tests instables: 0…Jetons de sortie: 2,247Jetons de raisonnement: 8,058Temps de réponse : moy. 3.22s · total 58.00s · max 11.91s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)2.12sTemps de réponse (max)3.18sTemps de réponse (total)8.50s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.20sTemps de réponse (max)2.20sTemps de réponse (total)2.20s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)11.91sTemps de réponse (max)11.91sTemps de réponse (total)11.91s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.00sTemps de réponse (max)3.74sTemps de réponse (total)5.99s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)2.36sTemps de réponse (max)3.51sTemps de réponse (total)7.07s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.54sTemps de réponse (max)1.54sTemps de réponse (total)1.54s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.49sTemps de réponse (max)1.66sTemps de réponse (total)2.99s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.76sTemps de réponse (max)5.08sTemps de réponse (total)8.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.54sTemps de réponse (max)9.54sTemps de réponse (total)9.54s
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 3…Jetons de sortie: 2,735Jetons de raisonnement: 52,571Temps de réponse : moy. 16.17s · total 291.09s · max 84.22s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.95sTemps de réponse (max)5.12sTemps de réponse (total)11.80s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)32.58sTemps de réponse (max)32.58sTemps de réponse (total)32.58s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)53.36sTemps de réponse (max)53.36sTemps de réponse (total)53.36s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)18.81sTemps de réponse (max)20.29sTemps de réponse (total)37.61s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 2Temps de réponse (moy.)37.87sTemps de réponse (max)84.22sTemps de réponse (total)113.60s
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.27sTemps de réponse (max)4.27sTemps de réponse (total)4.27s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.77sTemps de réponse (max)3.21sTemps de réponse (total)5.54s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.87sTemps de réponse (max)16.87sTemps de réponse (total)16.87s
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.8%Tests instables: 3…Jetons de sortie: 2,360Jetons de raisonnement: 38,320Temps de réponse : moy. 12.27s · total 208.56s · max 64.71s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.06sTemps de réponse (max)4.70sTemps de réponse (total)12.23s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)52.12sTemps de réponse (max)52.12sTemps de réponse (total)52.12s
Combiné
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)64.71sTemps de réponse (max)64.71sTemps de réponse (total)64.71s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)17.20sTemps de réponse (max)17.44sTemps de réponse (total)34.40s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)6.00sTemps de réponse (max)6.14sTemps de réponse (total)12.01s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.06sTemps de réponse (max)4.06sTemps de réponse (total)4.06s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.36sTemps de réponse (max)4.35sTemps de réponse (total)6.72s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.19sTemps de réponse (max)8.19sTemps de réponse (total)8.19s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 1…Jetons de sortie: 65,057Jetons de raisonnement: 0Temps de réponse : moy. 14.63s · total 248.72s · max 46.04s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.59sTemps de réponse (max)10.20sTemps de réponse (total)26.37s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.37sTemps de réponse (max)31.37sTemps de réponse (total)31.37s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.04sTemps de réponse (max)46.04sTemps de réponse (total)46.04s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)5.25sTemps de réponse (max)5.25sTemps de réponse (total)5.25s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)22.30sTemps de réponse (max)30.51sTemps de réponse (total)66.90s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.84sTemps de réponse (max)16.84sTemps de réponse (total)16.84s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.16sTemps de réponse (max)7.72sTemps de réponse (total)12.31s
Résolution d'énigmes
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)9.55sTemps de réponse (max)14.35sTemps de réponse (total)28.64s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.02sTemps de réponse (max)15.02sTemps de réponse (total)15.02s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 2…Jetons de sortie: 15,928Jetons de raisonnement: 44,631Temps de réponse : moy. 25.03s · total 425.48s · max 147.47s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.20sTemps de réponse (max)9.64sTemps de réponse (total)24.78s
Programmation
: 2.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)147.47sTemps de réponse (max)147.47sTemps de réponse (total)147.47s
Combiné
: 9.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)73.55sTemps de réponse (max)73.55sTemps de réponse (total)73.55s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.51sTemps de réponse (max)20.57sTemps de réponse (total)33.02s
Spécifique au domaine
: 2.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Délai dépassé: 1Temps de réponse (moy.)23.62sTemps de réponse (max)27.00sTemps de réponse (total)47.23s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)29.76sTemps de réponse (max)29.76sTemps de réponse (total)29.76s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.54sTemps de réponse (max)21.25sTemps de réponse (total)35.08s
Résolution d'énigmes
: 7.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)8.52sTemps de réponse (max)12.73sTemps de réponse (total)25.56s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.01sTemps de réponse (max)9.01sTemps de réponse (total)9.01s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 3Mauvaise réponse: 3Temps de réponse (moy.)9.81sTemps de réponse (max)31.36sTemps de réponse (total)176.62s…
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 2…Jetons de sortie: 1,568Jetons de raisonnement: 91,909Temps de réponse : moy. 9.81s · total 176.62s · max 31.36s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.16sTemps de réponse (max)3.44sTemps de réponse (total)12.65s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.36sTemps de réponse (max)31.36sTemps de réponse (total)31.36s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.93sTemps de réponse (max)20.93sTemps de réponse (total)20.93s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.01sTemps de réponse (max)4.27sTemps de réponse (total)8.02s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)21.33sTemps de réponse (max)24.21sTemps de réponse (total)64.00s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.78sTemps de réponse (max)5.78sTemps de réponse (total)5.78s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.97sTemps de réponse (max)6.05sTemps de réponse (total)9.94s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.85sTemps de réponse (max)4.53sTemps de réponse (total)11.55s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)12.39sTemps de réponse (max)12.39sTemps de réponse (total)12.39s
Tests totaux: 18Tests incorrects: 5Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 1…Jetons de sortie: 42,068Jetons de raisonnement: 26,784Temps de réponse : moy. 12.66s · total 126.62s · max 46.35s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)35.76sTemps de réponse (max)35.76sTemps de réponse (total)35.76s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)46.35sTemps de réponse (max)46.35sTemps de réponse (total)46.35s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.90sTemps de réponse (max)13.90sTemps de réponse (total)13.90s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.94sTemps de réponse (max)4.94sTemps de réponse (total)4.94s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.61sTemps de réponse (max)2.61sTemps de réponse (total)2.61s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.80sTemps de réponse (max)5.22sTemps de réponse (total)9.60s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.48sTemps de réponse (max)7.48sTemps de réponse (total)7.48s
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 79.6%Tests instables: 4…Jetons de sortie: 7,554Jetons de raisonnement: 45,588Temps de réponse : moy. 43.49s · total 782.73s · max 180.92s
Astuces anti-IA
: 8.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)30.72sTemps de réponse (max)44.23sTemps de réponse (total)122.88s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)180.92sTemps de réponse (max)180.92sTemps de réponse (total)180.92s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)93.11sTemps de réponse (max)93.11sTemps de réponse (total)93.11s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)36.09sTemps de réponse (max)39.12sTemps de réponse (total)72.18s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)21.78sTemps de réponse (max)30.66sTemps de réponse (total)65.35s
Intelligence générale
: 5.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)31.30sTemps de réponse (max)31.30sTemps de réponse (total)31.30s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)35.78sTemps de réponse (max)47.30sTemps de réponse (total)71.56s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)36.87sTemps de réponse (max)59.22sTemps de réponse (total)110.62s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)34.81sTemps de réponse (max)34.81sTemps de réponse (total)34.81s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5N'a pas suivi les instructions: 1Temps de réponse (moy.)6.84sTemps de réponse (max)38.52sTemps de réponse (total)123.17s…
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 3…Jetons de sortie: 17,346Jetons de raisonnement: 0Temps de réponse : moy. 6.84s · total 123.17s · max 38.52s
Astuces anti-IA
: 8.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.40sTemps de réponse (max)4.78sTemps de réponse (total)13.59s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.97sTemps de réponse (max)8.97sTemps de réponse (total)8.97s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.12sTemps de réponse (max)9.12sTemps de réponse (total)9.12s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.05sTemps de réponse (max)3.33sTemps de réponse (total)6.10s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)17.78sTemps de réponse (max)38.52sTemps de réponse (total)53.33s
Intelligence générale
: 4.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)3.20sTemps de réponse (max)3.20sTemps de réponse (total)3.20s
Suivi des instructions
: 7.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)5.46sTemps de réponse (max)6.45sTemps de réponse (total)10.92s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.42sTemps de réponse (max)5.04sTemps de réponse (total)13.27s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.68sTemps de réponse (max)4.68sTemps de réponse (total)4.68s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 2Temps de réponse (moy.)1.30sTemps de réponse (max)3.39sTemps de réponse (total)23.42s…
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 70.4%Tests instables: 1…Jetons de sortie: 5,361Jetons de raisonnement: 0Temps de réponse : moy. 1.30s · total 23.42s · max 3.39s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.47sTemps de réponse (max)1.47sTemps de réponse (total)1.47s
Combiné
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.20sTemps de réponse (max)3.20sTemps de réponse (total)3.20s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.22sTemps de réponse (max)1.33sTemps de réponse (total)2.44s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)942msTemps de réponse (max)1.12sTemps de réponse (total)2.83s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)741msTemps de réponse (max)741msTemps de réponse (total)741ms
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.13sTemps de réponse (max)1.14sTemps de réponse (total)2.27s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)972msTemps de réponse (max)1.13sTemps de réponse (total)2.92s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.39sTemps de réponse (max)3.39sTemps de réponse (total)3.39s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 3Mauvaise réponse: 3Temps de réponse (moy.)26.78sTemps de réponse (max)170.45sTemps de réponse (total)294.58s…
Tests totaux: 17Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 70.6%Tests instables: 2…Jetons de sortie: 71,904Jetons de raisonnement: 155,607Temps de réponse : moy. 26.78s · total 294.58s · max 170.45s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.56sTemps de réponse (max)32.30sTemps de réponse (total)40.68s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)29.57sTemps de réponse (max)29.57sTemps de réponse (total)29.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.01sTemps de réponse (max)15.01sTemps de réponse (total)15.01s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)170.45sTemps de réponse (max)170.45sTemps de réponse (total)170.45s
Intelligence générale
: 5.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.54sTemps de réponse (max)6.54sTemps de réponse (total)6.54s
Suivi des instructions
: 8.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.98sTemps de réponse (max)4.98sTemps de réponse (total)4.98s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.91sTemps de réponse (max)11.91sTemps de réponse (total)11.91s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 3Temps de réponse (moy.)47.47sTemps de réponse (max)255.28sTemps de réponse (total)854.45s…
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 79.6%Tests instables: 5…Jetons de sortie: 1,757Jetons de raisonnement: 55,907Temps de réponse : moy. 47.47s · total 854.45s · max 255.28s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)28.51sTemps de réponse (max)39.73sTemps de réponse (total)114.05s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)62.48sTemps de réponse (max)62.48sTemps de réponse (total)62.48s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)76.57sTemps de réponse (max)76.57sTemps de réponse (total)76.57s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)28.03sTemps de réponse (max)30.49sTemps de réponse (total)56.07s
Spécifique au domaine
: 4.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)112.69sTemps de réponse (max)255.28sTemps de réponse (total)338.07s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)25.15sTemps de réponse (max)25.15sTemps de réponse (total)25.15s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.36sTemps de réponse (max)19.53sTemps de réponse (total)30.73s
Résolution d'énigmes
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 2Temps de réponse (moy.)25.53sTemps de réponse (max)32.37sTemps de réponse (total)76.60s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)74.73sTemps de réponse (max)74.73sTemps de réponse (total)74.73s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 77.8%Tests instables: 6…Jetons de sortie: 2,351Jetons de raisonnement: 58,941Temps de réponse : moy. 14.96s · total 269.32s · max 67.08s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.78sTemps de réponse (max)13.78sTemps de réponse (total)13.78s
Combiné
: 6.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)15.06sTemps de réponse (max)15.06sTemps de réponse (total)15.06s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.60sTemps de réponse (max)9.92sTemps de réponse (total)19.19s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)38.15sTemps de réponse (max)67.08sTemps de réponse (total)114.45s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.09sTemps de réponse (max)11.09sTemps de réponse (total)11.09s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.74sTemps de réponse (max)5.23sTemps de réponse (total)7.47s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)10.91sTemps de réponse (max)18.97sTemps de réponse (total)32.74s
Appel d'outils
: 7.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Appel d'outil invalide: 1Temps de réponse (moy.)12.53sTemps de réponse (max)12.53sTemps de réponse (total)12.53s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 81.5%Tests instables: 6…Jetons de sortie: 2,073Jetons de raisonnement: 191,899Temps de réponse : moy. 66.72s · total 1201.03s · max 234.29s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)59.11sTemps de réponse (max)168.31sTemps de réponse (total)236.44s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)45.75sTemps de réponse (max)45.75sTemps de réponse (total)45.75s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.78sTemps de réponse (max)17.78sTemps de réponse (total)17.78s
Analyse et extraction des données
: 7.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)56.99sTemps de réponse (max)80.14sTemps de réponse (total)113.98s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)146.50sTemps de réponse (max)234.29sTemps de réponse (total)439.49s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)40.05sTemps de réponse (max)40.05sTemps de réponse (total)40.05s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)63.49sTemps de réponse (max)111.61sTemps de réponse (total)126.98s
Résolution d'énigmes
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Temps de réponse (moy.)56.74sTemps de réponse (max)115.01sTemps de réponse (total)170.23s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)10.33sTemps de réponse (max)10.33sTemps de réponse (total)10.33s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Délai dépassé: 2Erreur API: 1Temps de réponse (moy.)24.13sTemps de réponse (max)118.52sTemps de réponse (total)410.25s…
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 75.9%Tests instables: 3…Jetons de sortie: 8,005Jetons de raisonnement: 49,090Temps de réponse : moy. 24.13s · total 410.25s · max 118.52s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.31sTemps de réponse (max)14.20sTemps de réponse (total)33.24s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)118.52sTemps de réponse (max)118.52sTemps de réponse (total)118.52s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)43.11sTemps de réponse (max)43.11sTemps de réponse (total)43.11s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.33sTemps de réponse (max)9.40sTemps de réponse (total)18.66s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)29.77sTemps de réponse (max)32.22sTemps de réponse (total)89.30s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.95sTemps de réponse (max)20.95sTemps de réponse (total)20.95s
Suivi des instructions
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)7.47sTemps de réponse (max)10.16sTemps de réponse (total)14.94s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)23.85sTemps de réponse (max)33.09sTemps de réponse (total)71.54s
Appel d'outils
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 3…Jetons de sortie: 2,840Jetons de raisonnement: 116,242Temps de réponse : moy. 13.71s · total 246.73s · max 86.93s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.98sTemps de réponse (max)3.76sTemps de réponse (total)7.92s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)31.48sTemps de réponse (max)31.48sTemps de réponse (total)31.48s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)16.86sTemps de réponse (max)16.86sTemps de réponse (total)16.86s
Intelligence générale
: 3.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.55sTemps de réponse (max)1.55sTemps de réponse (total)1.55s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.80sTemps de réponse (max)1.81sTemps de réponse (total)3.60s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)20.60sTemps de réponse (max)57.93sTemps de réponse (total)61.79s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.29sTemps de réponse (max)7.29sTemps de réponse (total)7.29s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 74.1%Tests instables: 4…Jetons de sortie: 80,759Jetons de raisonnement: 179,814Temps de réponse : moy. 45.20s · total 768.37s · max 215.85s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)106.96sTemps de réponse (max)106.96sTemps de réponse (total)106.96s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)40.96sTemps de réponse (max)40.96sTemps de réponse (total)40.96s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)20.38sTemps de réponse (max)22.88sTemps de réponse (total)40.76s
Spécifique au domaine
: 5.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 2Temps de réponse (moy.)202.38sTemps de réponse (max)215.85sTemps de réponse (total)404.76s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.83sTemps de réponse (max)17.83sTemps de réponse (total)17.83s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)12.53sTemps de réponse (max)19.15sTemps de réponse (total)25.06s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.92sTemps de réponse (max)8.92sTemps de réponse (total)8.92s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 61.1%Tests instables: 0…Jetons de sortie: 928Jetons de raisonnement: 72,661Temps de réponse : moy. 16.76s · total 301.61s · max 158.78s
Astuces anti-IA
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.11sTemps de réponse (max)3.43sTemps de réponse (total)8.43s
Programmation
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)68.55sTemps de réponse (max)68.55sTemps de réponse (total)68.55s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)19.29sTemps de réponse (max)19.29sTemps de réponse (total)19.29s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.29sTemps de réponse (max)2.62sTemps de réponse (total)4.58s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.86sTemps de réponse (max)2.86sTemps de réponse (total)2.86s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.92sTemps de réponse (max)7.14sTemps de réponse (total)9.83s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.07sTemps de réponse (max)11.07sTemps de réponse (total)11.07s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 5N'a pas suivi les instructions: 2Temps de réponse (moy.)5.88sTemps de réponse (max)18.33sTemps de réponse (total)105.90s…
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 68.5%Tests instables: 3…Jetons de sortie: 20,784Jetons de raisonnement: 0Temps de réponse : moy. 5.88s · total 105.90s · max 18.33s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.32sTemps de réponse (max)9.32sTemps de réponse (total)9.32s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)11.96sTemps de réponse (max)11.96sTemps de réponse (total)11.96s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.21sTemps de réponse (max)2.52sTemps de réponse (total)4.42s
Spécifique au domaine
: 3.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)13.01sTemps de réponse (max)18.33sTemps de réponse (total)39.04s
Intelligence générale
: 4.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)1.99sTemps de réponse (max)1.99sTemps de réponse (total)1.99s
Suivi des instructions
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.29sTemps de réponse (max)4.18sTemps de réponse (total)6.59s
Résolution d'énigmes
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.93sTemps de réponse (max)3.05sTemps de réponse (total)8.78s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.36sTemps de réponse (max)8.36sTemps de réponse (total)8.36s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 4Mauvaise réponse: 2Temps de réponse (moy.)21.08sTemps de réponse (max)83.40sTemps de réponse (total)231.84s…
Tests totaux: 18Tests incorrects: 6Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 70.4%Tests instables: 2…Jetons de sortie: 29,829Jetons de raisonnement: 18,938Temps de réponse : moy. 21.08s · total 231.84s · max 83.40s
Astuces anti-IA
: 6.4 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 2Temps de réponse (moy.)7.45sTemps de réponse (max)11.88sTemps de réponse (total)14.90s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.11sTemps de réponse (max)23.11sTemps de réponse (total)23.11s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)76.66sTemps de réponse (max)76.66sTemps de réponse (total)76.66s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.37sTemps de réponse (max)7.37sTemps de réponse (total)7.37s
Intelligence générale
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.04sTemps de réponse (max)5.04sTemps de réponse (total)5.04s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.43sTemps de réponse (max)2.43sTemps de réponse (total)2.43s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.60sTemps de réponse (max)4.66sTemps de réponse (total)9.20s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)9.73sTemps de réponse (max)9.73sTemps de réponse (total)9.73s
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 4N'a pas suivi les instructions: 3Temps de réponse (moy.)11.21sTemps de réponse (max)94.06sTemps de réponse (total)201.80s…
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 68.5%Tests instables: 2…Jetons de sortie: 2,946Jetons de raisonnement: 58,132Temps de réponse : moy. 11.21s · total 201.80s · max 94.06s
Astuces anti-IA
: 8.3 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)4.52sTemps de réponse (max)7.74sTemps de réponse (total)18.10s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)13.41sTemps de réponse (max)13.41sTemps de réponse (total)13.41s
Combiné
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.13sTemps de réponse (max)24.13sTemps de réponse (total)24.13s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)2.54sTemps de réponse (max)3.33sTemps de réponse (total)5.08s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)38.18sTemps de réponse (max)94.06sTemps de réponse (total)114.53s
Intelligence générale
: 4.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.15sTemps de réponse (max)4.15sTemps de réponse (total)4.15s
Suivi des instructions
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)1.88sTemps de réponse (max)2.61sTemps de réponse (total)3.75s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.71sTemps de réponse (max)7.71sTemps de réponse (total)7.71s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 66.7%Tests instables: 2…Jetons de sortie: 2,419Jetons de raisonnement: 79,238Temps de réponse : moy. 69.70s · total 1045.47s · max 262.83s
Astuces anti-IA
: 6.6 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)74.75sTemps de réponse (max)182.10sTemps de réponse (total)298.98s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)197.31sTemps de réponse (max)197.31sTemps de réponse (total)197.31s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)262.83sTemps de réponse (max)262.83sTemps de réponse (total)262.83s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)24.27sTemps de réponse (max)27.52sTemps de réponse (total)48.54s
Spécifique au domaine
: 3.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 3Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Intelligence générale
: 5.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)36.65sTemps de réponse (max)36.65sTemps de réponse (total)36.65s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.47sTemps de réponse (max)19.46sTemps de réponse (total)34.93s
Résolution d'énigmes
: 8.2 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)25.85sTemps de réponse (max)32.95sTemps de réponse (total)77.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)88.68sTemps de réponse (max)88.68sTemps de réponse (total)88.68s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 72.2%Tests instables: 4…Jetons de sortie: 2,705Jetons de raisonnement: 18,977Temps de réponse : moy. 14.04s · total 154.41s · max 77.80s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)15.12sTemps de réponse (max)15.12sTemps de réponse (total)15.12s
Combiné
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)14.06sTemps de réponse (max)14.06sTemps de réponse (total)14.06s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.15sTemps de réponse (max)3.15sTemps de réponse (total)3.15s
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)77.80sTemps de réponse (max)77.80sTemps de réponse (total)77.80s
Intelligence générale
: 3.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.32sTemps de réponse (max)4.32sTemps de réponse (total)4.32s
Suivi des instructions
: 9.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.12sTemps de réponse (max)3.12sTemps de réponse (total)3.12s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)5.47sTemps de réponse (max)6.45sTemps de réponse (total)10.94s
Appel d'outils
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse: 1Temps de réponse (moy.)10.30sTemps de réponse (max)10.30sTemps de réponse (total)10.30s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 70.4%Tests instables: 3…Jetons de sortie: 12,387Jetons de raisonnement: 115,182Temps de réponse : moy. 23.36s · total 280.34s · max 96.01s
Astuces anti-IA
: 8.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)15.85sTemps de réponse (max)20.83sTemps de réponse (total)47.55s
Programmation
: 4.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)13.03sTemps de réponse (max)13.03sTemps de réponse (total)13.03s
Combiné
: 9.8 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)75.68sTemps de réponse (max)75.68sTemps de réponse (total)75.68s
Analyse et extraction des données
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0ms
Spécifique au domaine
: 5.9 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)96.01sTemps de réponse (max)96.01sTemps de réponse (total)96.01s
Intelligence générale
: 4.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)4.20sTemps de réponse (max)4.20sTemps de réponse (total)4.20s
Suivi des instructions
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.28sTemps de réponse (max)7.37sTemps de réponse (total)8.55s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.77sTemps de réponse (max)5.26sTemps de réponse (total)7.55s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)27.78sTemps de réponse (max)27.78sTemps de réponse (total)27.78s
Tests totaux: 18Tests incorrects: 7Fiabilité: N/DLa télémétrie de fiabilité est indisponible ou incomplète pour ce modèle.Taux de réussite par tentative: 64.8%Tests instables: 1…Jetons de sortie: 7,433Jetons de raisonnement: 0Temps de réponse : moy. 4.98s · total 54.83s · max 23.84s
Programmation
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.67sTemps de réponse (max)3.67sTemps de réponse (total)3.67s
Combiné
: 9.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.84sTemps de réponse (max)23.84sTemps de réponse (total)23.84s
Analyse et extraction des données
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)3.43sTemps de réponse (max)3.43sTemps de réponse (total)3.43s
Spécifique au domaine
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)3.54sTemps de réponse (max)3.54sTemps de réponse (total)3.54s
Intelligence générale
: 6.1 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)2.56sTemps de réponse (max)2.56sTemps de réponse (total)2.56s
Suivi des instructions
: 6.5 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)1.96sTemps de réponse (max)1.96sTemps de réponse (total)1.96s
Résolution d'énigmes
: 7.7 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Temps de réponse (moy.)2.92sTemps de réponse (max)3.33sTemps de réponse (total)5.84s
Appel d'outils
: 10.0 Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.11sTemps de réponse (max)4.11sTemps de réponse (total)4.11s