Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.11sResponstijd (max)82.37sResponstijd (totaal)217.93s…
Totaal tests: 18Foute tests: 0Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 100.0%Instabiele tests: 0…Uitvoer-tokens: 655Redeneer-tokens: 33,749Responstijd: gem. 12.11s · totaal 217.93s · max 82.37s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.26sResponstijd (max)5.01sResponstijd (totaal)13.04s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)82.37sResponstijd (max)82.37sResponstijd (totaal)82.37s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.58sResponstijd (max)23.58sResponstijd (totaal)23.58s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.62sResponstijd (max)8.37sResponstijd (totaal)15.24s
Domeinspecifiek
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.81sResponstijd (max)32.44sResponstijd (totaal)44.43s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.34sResponstijd (max)6.34sResponstijd (totaal)6.34s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.30sResponstijd (max)5.19sResponstijd (totaal)8.59s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.86sResponstijd (max)7.59sResponstijd (totaal)14.57s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.78sResponstijd (max)9.78sResponstijd (totaal)9.78s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)15.96sResponstijd (max)40.61sResponstijd (totaal)175.52s…
Totaal tests: 18Foute tests: 1Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 94.4%Instabiele tests: 0…Uitvoer-tokens: 1,932Redeneer-tokens: 40,542Responstijd: gem. 15.96s · totaal 175.52s · max 40.61s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.90sResponstijd (max)9.52sResponstijd (totaal)15.80s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)19.88sResponstijd (max)19.88sResponstijd (totaal)19.88s
Gecombineerd
: 9.5 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)40.61sResponstijd (max)40.61sResponstijd (totaal)40.61s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.72sResponstijd (max)7.72sResponstijd (totaal)7.72s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)32.73sResponstijd (max)32.73sResponstijd (totaal)32.73s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.77sResponstijd (max)11.77sResponstijd (totaal)11.77s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.56sResponstijd (max)9.56sResponstijd (totaal)9.56s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.15sResponstijd (max)8.49sResponstijd (totaal)14.30s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.15sResponstijd (max)23.15sResponstijd (totaal)23.15s
Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)3.53sResponstijd (max)21.45sResponstijd (totaal)60.03s…
Totaal tests: 18Foute tests: 2Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 88.9%Instabiele tests: 0…Uitvoer-tokens: 5,375Redeneer-tokens: 1,341Responstijd: gem. 3.53s · totaal 60.03s · max 21.45s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.85sResponstijd (max)2.71sResponstijd (totaal)7.38s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.41sResponstijd (max)6.41sResponstijd (totaal)6.41s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)21.45sResponstijd (max)21.45sResponstijd (totaal)21.45s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.37sResponstijd (max)3.30sResponstijd (totaal)4.74s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)1.17sResponstijd (max)1.40sResponstijd (totaal)2.35s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.87sResponstijd (max)2.87sResponstijd (totaal)2.87s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.57sResponstijd (max)1.66sResponstijd (totaal)3.14s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.51sResponstijd (max)2.89sResponstijd (totaal)7.54s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.17sResponstijd (max)4.17sResponstijd (totaal)4.17s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)3.13sResponstijd (max)18.27sResponstijd (totaal)56.33s…
Totaal tests: 18Foute tests: 2Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 88.9%Instabiele tests: 0…Uitvoer-tokens: 6,326Redeneer-tokens: 0Responstijd: gem. 3.13s · totaal 56.33s · max 18.27s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.12sResponstijd (max)3.75sResponstijd (totaal)8.50s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.84sResponstijd (max)2.84sResponstijd (totaal)2.84s
Gecombineerd
: 9.5 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)18.27sResponstijd (max)18.27sResponstijd (totaal)18.27s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.15sResponstijd (max)2.33sResponstijd (totaal)4.29s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.19sResponstijd (max)1.40sResponstijd (totaal)3.58s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.47sResponstijd (max)3.47sResponstijd (totaal)3.47s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.46sResponstijd (max)1.68sResponstijd (totaal)2.91s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.58sResponstijd (max)4.07sResponstijd (totaal)7.73s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.74sResponstijd (max)4.74sResponstijd (totaal)4.74s
Totaal tests: 18Foute tests: 3Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 87.0%Instabiele tests: 2…Uitvoer-tokens: 1,920Redeneer-tokens: 89,632Responstijd: gem. 32.75s · totaal 589.59s · max 332.10s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.66sResponstijd (max)6.74sResponstijd (totaal)18.65s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.09sResponstijd (max)9.09sResponstijd (totaal)9.09s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)19.29sResponstijd (max)19.29sResponstijd (totaal)19.29s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.18sResponstijd (max)4.35sResponstijd (totaal)8.36s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)164.14sResponstijd (max)332.10sResponstijd (totaal)492.41s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.16sResponstijd (max)4.16sResponstijd (totaal)4.16s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.36sResponstijd (max)3.46sResponstijd (totaal)6.73s
Puzzeloplossing
: 8.6 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)6.78sResponstijd (max)10.54sResponstijd (totaal)20.33s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)10.57sResponstijd (max)10.57sResponstijd (totaal)10.57s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)6.01sResponstijd (max)14.72sResponstijd (totaal)108.12s…
Totaal tests: 18Foute tests: 3Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 85.2%Instabiele tests: 1…Uitvoer-tokens: 2,018Redeneer-tokens: 23,273Responstijd: gem. 6.01s · totaal 108.12s · max 14.72s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.48sResponstijd (max)4.31sResponstijd (totaal)13.94s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.94sResponstijd (max)6.94sResponstijd (totaal)6.94s
Gecombineerd
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.27sResponstijd (max)3.27sResponstijd (totaal)3.27s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.40sResponstijd (max)14.72sResponstijd (totaal)18.80s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)8.05sResponstijd (max)14.40sResponstijd (totaal)24.15s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.68sResponstijd (max)3.68sResponstijd (totaal)3.68s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.02sResponstijd (max)7.35sResponstijd (totaal)14.03s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.11sResponstijd (max)10.27sResponstijd (totaal)18.32s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.99sResponstijd (max)4.99sResponstijd (totaal)4.99s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 83.3%Instabiele tests: 3…Uitvoer-tokens: 3,257Redeneer-tokens: 52,042Responstijd: gem. 30.37s · totaal 546.72s · max 168.71s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)17.99sResponstijd (max)48.33sResponstijd (totaal)71.98s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)74.49sResponstijd (max)74.49sResponstijd (totaal)74.49s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)37.67sResponstijd (max)37.67sResponstijd (totaal)37.67s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.07sResponstijd (max)12.19sResponstijd (totaal)18.14s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)88.74sResponstijd (max)168.71sResponstijd (totaal)266.21s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.26sResponstijd (max)9.02sResponstijd (totaal)14.52s
Puzzeloplossing
: 9.0 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)11.03sResponstijd (max)13.85sResponstijd (totaal)33.09s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.38sResponstijd (max)12.38sResponstijd (totaal)12.38s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 83.3%Instabiele tests: 3…Uitvoer-tokens: 2,279Redeneer-tokens: 35,179Responstijd: gem. 15.38s · totaal 276.91s · max 100.93s
Anti-AI-trucs
: 8.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)4.16sResponstijd (max)6.68sResponstijd (totaal)16.63s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.95sResponstijd (max)8.95sResponstijd (totaal)8.95s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)19.56sResponstijd (max)19.56sResponstijd (totaal)19.56s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.07sResponstijd (max)3.59sResponstijd (totaal)6.15s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)64.31sResponstijd (max)100.93sResponstijd (totaal)192.94s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.04sResponstijd (max)3.44sResponstijd (totaal)6.07s
Puzzeloplossing
: 9.0 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)5.12sResponstijd (max)8.73sResponstijd (totaal)15.37s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.37sResponstijd (max)6.37sResponstijd (totaal)6.37s
Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 2Verkeerd antwoord: 2Responstijd (gem.)46.56sResponstijd (max)120.91sResponstijd (totaal)512.20s…
Totaal tests: 18Foute tests: 4Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 83.3%Instabiele tests: 2…Uitvoer-tokens: 2,121Redeneer-tokens: 111,889Responstijd: gem. 46.56s · totaal 512.20s · max 120.91s
Anti-AI-trucs
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)45.78sResponstijd (max)81.20sResponstijd (totaal)91.57s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)120.91sResponstijd (max)120.91sResponstijd (totaal)120.91s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)46.85sResponstijd (max)46.85sResponstijd (totaal)46.85s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)46.91sResponstijd (max)46.91sResponstijd (totaal)46.91s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)17.50sResponstijd (max)17.50sResponstijd (totaal)17.50s
Algemene intelligentie
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)79.86sResponstijd (max)79.86sResponstijd (totaal)79.86s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)31.93sResponstijd (max)31.93sResponstijd (totaal)31.93s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)34.57sResponstijd (max)49.12sResponstijd (totaal)69.13s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.54sResponstijd (max)7.54sResponstijd (totaal)7.54s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 81.5%Instabiele tests: 3…Uitvoer-tokens: 238,920Redeneer-tokens: 0Responstijd: gem. 55.19s · totaal 938.23s · max 149.94s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)32.69sResponstijd (max)85.41sResponstijd (totaal)130.78s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)99.76sResponstijd (max)99.76sResponstijd (totaal)99.76s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)113.09sResponstijd (max)113.09sResponstijd (totaal)113.09s
Gegevensparsering en extractie
: 6.5 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)12.11sResponstijd (max)12.11sResponstijd (totaal)12.11s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)109.04sResponstijd (max)149.94sResponstijd (totaal)327.11s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)24.31sResponstijd (max)24.31sResponstijd (totaal)24.31s
Puzzeloplossing
: 9.0 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)28.07sResponstijd (max)45.06sResponstijd (totaal)84.21s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)78.83sResponstijd (max)78.83sResponstijd (totaal)78.83s
Totaal tests: 17Foute tests: 4Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 76.5%Instabiele tests: 0…Uitvoer-tokens: 1,756Redeneer-tokens: 77,213Responstijd: gem. 13.94s · totaal 237.01s · max 43.55s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.90sResponstijd (max)19.37sResponstijd (totaal)39.60s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)34.95sResponstijd (max)34.95sResponstijd (totaal)34.95s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.95sResponstijd (max)15.40sResponstijd (totaal)29.90s
Domeinspecifiek
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)22.08sResponstijd (max)43.55sResponstijd (totaal)66.23s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.54sResponstijd (max)11.67sResponstijd (totaal)15.07s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.11sResponstijd (max)7.52sResponstijd (totaal)18.34s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.87sResponstijd (max)5.87sResponstijd (totaal)5.87s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 81.5%Instabiele tests: 3…Uitvoer-tokens: 2,500Redeneer-tokens: 242,500Responstijd: gem. 53.03s · totaal 954.46s · max 163.96s
Anti-AI-trucs
: 8.7 Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 1Responstijd (gem.)19.75sResponstijd (max)49.95sResponstijd (totaal)79.01s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)70.35sResponstijd (max)70.35sResponstijd (totaal)70.35s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)163.96sResponstijd (max)163.96sResponstijd (totaal)163.96s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)30.26sResponstijd (max)32.03sResponstijd (totaal)60.52s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)79.53sResponstijd (max)95.52sResponstijd (totaal)238.59s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)19.66sResponstijd (max)32.25sResponstijd (totaal)39.32s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)64.61sResponstijd (max)123.57sResponstijd (totaal)193.84s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.45sResponstijd (max)7.45sResponstijd (totaal)7.45s
Totaal tests: 16Foute tests: 4Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.1%Instabiele tests: 1…Uitvoer-tokens: 1,283Redeneer-tokens: 1,533,310Responstijd: gem. 68.83s · totaal 1101.32s · max 280.52s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)43.87sResponstijd (max)121.88sResponstijd (totaal)131.62s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)280.52sResponstijd (max)280.52sResponstijd (totaal)280.52s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.16sResponstijd (max)8.54sResponstijd (totaal)14.31s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)127.58sResponstijd (max)133.93sResponstijd (totaal)382.74s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.25sResponstijd (max)5.25sResponstijd (totaal)5.25s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)46.33sResponstijd (max)134.22sResponstijd (totaal)139.00s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.73sResponstijd (max)7.73sResponstijd (totaal)7.73s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3API-fout: 1Responstijd (gem.)9.06sResponstijd (max)26.24sResponstijd (totaal)90.58s…
Totaal tests: 18Foute tests: 4Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.8%Instabiele tests: 0…Uitvoer-tokens: 1,508Redeneer-tokens: 10,084Responstijd: gem. 9.06s · totaal 90.58s · max 26.24s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.99sResponstijd (max)26.24sResponstijd (totaal)29.99s
Programmeren
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Gecombineerd
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)10.37sResponstijd (max)10.37sResponstijd (totaal)10.37s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)10.84sResponstijd (max)10.84sResponstijd (totaal)10.84s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)7.01sResponstijd (max)7.01sResponstijd (totaal)7.01s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.34sResponstijd (max)9.34sResponstijd (totaal)9.34s
Instructies opvolgen
: 9.8 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.26sResponstijd (max)3.26sResponstijd (totaal)3.26s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.91sResponstijd (max)4.23sResponstijd (totaal)7.81s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.96sResponstijd (max)11.96sResponstijd (totaal)11.96s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 85.2%Instabiele tests: 4…Uitvoer-tokens: 20,163Redeneer-tokens: 58,337Responstijd: gem. 23.34s · totaal 233.40s · max 79.09s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.66sResponstijd (max)25.06sResponstijd (totaal)47.32s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)79.09sResponstijd (max)79.09sResponstijd (totaal)79.09s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)28.96sResponstijd (max)28.96sResponstijd (totaal)28.96s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.25sResponstijd (max)7.25sResponstijd (totaal)7.25s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.64sResponstijd (max)16.34sResponstijd (totaal)31.27s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.93sResponstijd (max)15.93sResponstijd (totaal)15.93s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 79.6%Instabiele tests: 2…Uitvoer-tokens: 12,734Redeneer-tokens: 27,950Responstijd: gem. 24.88s · totaal 398.13s · max 70.97s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.89sResponstijd (max)26.66sResponstijd (totaal)51.55s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)70.97sResponstijd (max)70.97sResponstijd (totaal)70.97s
Gecombineerd
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)21.11sResponstijd (max)21.94sResponstijd (totaal)42.21s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)38.48sResponstijd (max)68.92sResponstijd (totaal)115.43s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.57sResponstijd (max)9.57sResponstijd (totaal)9.57s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.76sResponstijd (max)17.53sResponstijd (totaal)25.52s
Puzzeloplossing
: 8.8 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)27.63sResponstijd (max)61.08sResponstijd (totaal)82.89s
Toolaanroepen
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 1…Uitvoer-tokens: 1,898Redeneer-tokens: 122,273Responstijd: gem. 12.12s · totaal 218.12s · max 95.48s
Anti-AI-trucs
: 8.4 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)6.30sResponstijd (max)15.56sResponstijd (totaal)25.21s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.23sResponstijd (max)16.23sResponstijd (totaal)16.23s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)28.44sResponstijd (max)28.44sResponstijd (totaal)28.44s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.06sResponstijd (max)5.06sResponstijd (totaal)8.11s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)37.34sResponstijd (max)95.48sResponstijd (totaal)112.01s
Instructies opvolgen
: 9.8 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.62sResponstijd (max)2.78sResponstijd (totaal)5.24s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.94sResponstijd (max)6.33sResponstijd (totaal)11.83s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.20sResponstijd (max)6.20sResponstijd (totaal)6.20s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 79.6%Instabiele tests: 3…Uitvoer-tokens: 2,169Redeneer-tokens: 48,732Responstijd: gem. 18.63s · totaal 335.26s · max 100.41s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)4.11sResponstijd (max)6.42sResponstijd (totaal)16.42s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.03sResponstijd (max)13.03sResponstijd (totaal)13.03s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)20.57sResponstijd (max)20.57sResponstijd (totaal)20.57s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.32sResponstijd (max)5.40sResponstijd (totaal)10.64s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)74.27sResponstijd (max)100.41sResponstijd (totaal)222.80s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.11sResponstijd (max)3.68sResponstijd (totaal)6.22s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)9.13sResponstijd (max)18.14sResponstijd (totaal)27.39s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.28sResponstijd (max)13.28sResponstijd (totaal)13.28s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 72.2%Instabiele tests: 0…Uitvoer-tokens: 2,168Redeneer-tokens: 29,030Responstijd: gem. 3.74s · totaal 67.31s · max 14.93s
Anti-AI-trucs
: 9.1 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)2.33sResponstijd (max)3.89sResponstijd (totaal)9.30s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.34sResponstijd (max)4.34sResponstijd (totaal)4.34s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.93sResponstijd (max)14.93sResponstijd (totaal)14.93s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.29sResponstijd (max)2.31sResponstijd (totaal)4.59s
Domeinspecifiek
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)4.21sResponstijd (max)5.86sResponstijd (totaal)12.62s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.16sResponstijd (max)3.16sResponstijd (totaal)3.16s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.91sResponstijd (max)1.93sResponstijd (totaal)3.82s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.58sResponstijd (max)4.41sResponstijd (totaal)10.75s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.80sResponstijd (max)3.80sResponstijd (totaal)3.80s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 1…Uitvoer-tokens: 671Redeneer-tokens: 39,383Responstijd: gem. 71.21s · totaal 1281.73s · max 351.99s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)26.93sResponstijd (max)61.35sResponstijd (totaal)107.71s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)93.00sResponstijd (max)93.00sResponstijd (totaal)93.00s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)71.08sResponstijd (max)71.08sResponstijd (totaal)71.08s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)63.00sResponstijd (max)102.80sResponstijd (totaal)126.00s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)202.56sResponstijd (max)351.99sResponstijd (totaal)607.68s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.60sResponstijd (max)20.03sResponstijd (totaal)29.20s
Puzzeloplossing
: 7.6 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)69.69sResponstijd (max)92.65sResponstijd (totaal)209.06s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.05sResponstijd (max)11.05sResponstijd (totaal)11.05s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.8%Instabiele tests: 5…Uitvoer-tokens: 12,197Redeneer-tokens: 38,933Responstijd: gem. 17.67s · totaal 317.98s · max 194.23s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.82sResponstijd (max)7.69sResponstijd (totaal)19.26s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.26sResponstijd (max)12.26sResponstijd (totaal)12.26s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.88sResponstijd (max)13.88sResponstijd (totaal)13.88s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.19sResponstijd (max)6.42sResponstijd (totaal)12.38s
Domeinspecifiek
: 2.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Time-out: 1Responstijd (gem.)71.07sResponstijd (max)194.23sResponstijd (totaal)213.22s
Algemene intelligentie
: 6.1 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)10.05sResponstijd (max)10.05sResponstijd (totaal)10.05s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.38sResponstijd (max)5.70sResponstijd (totaal)10.77s
Puzzeloplossing
: 7.3 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 2Responstijd (gem.)5.44sResponstijd (max)7.26sResponstijd (totaal)16.32s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.84sResponstijd (max)9.84sResponstijd (totaal)9.84s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Time-out: 2Responstijd (gem.)31.38sResponstijd (max)119.29sResponstijd (totaal)564.84s…
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 79.6%Instabiele tests: 3…Uitvoer-tokens: 17,635Redeneer-tokens: 162,668Responstijd: gem. 31.38s · totaal 564.84s · max 119.29s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.75sResponstijd (max)18.03sResponstijd (totaal)39.01s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)70.98sResponstijd (max)70.98sResponstijd (totaal)70.98s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)107.79sResponstijd (max)107.79sResponstijd (totaal)107.79s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.41sResponstijd (max)29.79sResponstijd (totaal)46.83s
Domeinspecifiek
: 2.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)63.40sResponstijd (max)119.29sResponstijd (totaal)190.20s
Algemene intelligentie
: 3.4 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)34.11sResponstijd (max)34.11sResponstijd (totaal)34.11s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.88sResponstijd (max)15.44sResponstijd (totaal)19.76s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.18sResponstijd (max)31.99sResponstijd (totaal)51.55s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.60sResponstijd (max)4.60sResponstijd (totaal)4.60s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 1…Uitvoer-tokens: 1,763Redeneer-tokens: 83,782Responstijd: gem. 15.27s · totaal 259.55s · max 43.55s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.90sResponstijd (max)19.37sResponstijd (totaal)39.60s
Programmeren
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)34.95sResponstijd (max)34.95sResponstijd (totaal)34.95s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.95sResponstijd (max)15.40sResponstijd (totaal)29.90s
Domeinspecifiek
: 2.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)29.59sResponstijd (max)43.55sResponstijd (totaal)88.77s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.54sResponstijd (max)11.67sResponstijd (totaal)15.07s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.11sResponstijd (max)7.52sResponstijd (totaal)18.34s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.87sResponstijd (max)5.87sResponstijd (totaal)5.87s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 1…Uitvoer-tokens: 65,778Redeneer-tokens: 0Responstijd: gem. 23.98s · totaal 407.72s · max 78.74s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.61sResponstijd (max)38.50sResponstijd (totaal)66.46s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)27.94sResponstijd (max)27.94sResponstijd (totaal)27.94s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)78.74sResponstijd (max)78.74sResponstijd (totaal)78.74s
Gegevensparsering en extractie
: 6.5 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)5.85sResponstijd (max)5.85sResponstijd (totaal)5.85s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)40.44sResponstijd (max)46.32sResponstijd (totaal)121.31s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.44sResponstijd (max)16.44sResponstijd (totaal)16.44s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.98sResponstijd (max)22.24sResponstijd (totaal)31.97s
Puzzeloplossing
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 2Responstijd (gem.)13.73sResponstijd (max)25.82sResponstijd (totaal)41.19s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.84sResponstijd (max)17.84sResponstijd (totaal)17.84s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.8%Instabiele tests: 2…Uitvoer-tokens: 1,840Redeneer-tokens: 0Responstijd: gem. 1.65s · totaal 18.20s · max 3.56s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.25sResponstijd (max)1.59sResponstijd (totaal)2.49s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.59sResponstijd (max)1.59sResponstijd (totaal)1.59s
Gecombineerd
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.56sResponstijd (max)3.56sResponstijd (totaal)3.56s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.41sResponstijd (max)1.41sResponstijd (totaal)1.41s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)963msResponstijd (max)963msResponstijd (totaal)963ms
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.13sResponstijd (max)1.13sResponstijd (totaal)1.13s
Instructies opvolgen
: 6.4 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.58sResponstijd (max)1.58sResponstijd (totaal)1.58s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.06sResponstijd (max)1.06sResponstijd (totaal)2.12s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.35sResponstijd (max)3.35sResponstijd (totaal)3.35s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 72.2%Instabiele tests: 0…Uitvoer-tokens: 2,247Redeneer-tokens: 8,058Responstijd: gem. 3.22s · totaal 58.00s · max 11.91s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)2.12sResponstijd (max)3.18sResponstijd (totaal)8.50s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.20sResponstijd (max)2.20sResponstijd (totaal)2.20s
Gecombineerd
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)11.91sResponstijd (max)11.91sResponstijd (totaal)11.91s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.00sResponstijd (max)3.74sResponstijd (totaal)5.99s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)2.36sResponstijd (max)3.51sResponstijd (totaal)7.07s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.49sResponstijd (max)1.66sResponstijd (totaal)2.99s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.76sResponstijd (max)5.08sResponstijd (totaal)8.27s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.54sResponstijd (max)9.54sResponstijd (totaal)9.54s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 3…Uitvoer-tokens: 2,735Redeneer-tokens: 52,571Responstijd: gem. 16.17s · totaal 291.09s · max 84.22s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.95sResponstijd (max)5.12sResponstijd (totaal)11.80s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)32.58sResponstijd (max)32.58sResponstijd (totaal)32.58s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)53.36sResponstijd (max)53.36sResponstijd (totaal)53.36s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 2Responstijd (gem.)37.87sResponstijd (max)84.22sResponstijd (totaal)113.60s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.77sResponstijd (max)3.21sResponstijd (totaal)5.54s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.87sResponstijd (max)16.87sResponstijd (totaal)16.87s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.8%Instabiele tests: 3…Uitvoer-tokens: 2,360Redeneer-tokens: 38,320Responstijd: gem. 12.27s · totaal 208.56s · max 64.71s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.06sResponstijd (max)4.70sResponstijd (totaal)12.23s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)52.12sResponstijd (max)52.12sResponstijd (totaal)52.12s
Gecombineerd
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)64.71sResponstijd (max)64.71sResponstijd (totaal)64.71s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.06sResponstijd (max)4.06sResponstijd (totaal)4.06s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.36sResponstijd (max)4.35sResponstijd (totaal)6.72s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.19sResponstijd (max)8.19sResponstijd (totaal)8.19s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 1…Uitvoer-tokens: 65,057Redeneer-tokens: 0Responstijd: gem. 14.63s · totaal 248.72s · max 46.04s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.59sResponstijd (max)10.20sResponstijd (totaal)26.37s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)31.37sResponstijd (max)31.37sResponstijd (totaal)31.37s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)46.04sResponstijd (max)46.04sResponstijd (totaal)46.04s
Gegevensparsering en extractie
: 6.5 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)5.25sResponstijd (max)5.25sResponstijd (totaal)5.25s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)22.30sResponstijd (max)30.51sResponstijd (totaal)66.90s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.84sResponstijd (max)16.84sResponstijd (totaal)16.84s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.16sResponstijd (max)7.72sResponstijd (totaal)12.31s
Puzzeloplossing
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 2Responstijd (gem.)9.55sResponstijd (max)14.35sResponstijd (totaal)28.64s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.02sResponstijd (max)15.02sResponstijd (totaal)15.02s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 2…Uitvoer-tokens: 15,928Redeneer-tokens: 44,631Responstijd: gem. 25.03s · totaal 425.48s · max 147.47s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)6.20sResponstijd (max)9.64sResponstijd (totaal)24.78s
Programmeren
: 2.8 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)147.47sResponstijd (max)147.47sResponstijd (totaal)147.47s
Gecombineerd
: 9.6 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)73.55sResponstijd (max)73.55sResponstijd (totaal)73.55s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.51sResponstijd (max)20.57sResponstijd (totaal)33.02s
Domeinspecifiek
: 2.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Time-out: 1Responstijd (gem.)23.62sResponstijd (max)27.00sResponstijd (totaal)47.23s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)29.76sResponstijd (max)29.76sResponstijd (totaal)29.76s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.54sResponstijd (max)21.25sResponstijd (totaal)35.08s
Puzzeloplossing
: 7.9 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)8.52sResponstijd (max)12.73sResponstijd (totaal)25.56s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.01sResponstijd (max)9.01sResponstijd (totaal)9.01s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 2…Uitvoer-tokens: 1,568Redeneer-tokens: 91,909Responstijd: gem. 9.81s · totaal 176.62s · max 31.36s
Anti-AI-trucs
: 8.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.16sResponstijd (max)3.44sResponstijd (totaal)12.65s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)31.36sResponstijd (max)31.36sResponstijd (totaal)31.36s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)20.93sResponstijd (max)20.93sResponstijd (totaal)20.93s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.01sResponstijd (max)4.27sResponstijd (totaal)8.02s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)21.33sResponstijd (max)24.21sResponstijd (totaal)64.00s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.78sResponstijd (max)5.78sResponstijd (totaal)5.78s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)3.85sResponstijd (max)4.53sResponstijd (totaal)11.55s
Toolaanroepen
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)12.39sResponstijd (max)12.39sResponstijd (totaal)12.39s
Totaal tests: 18Foute tests: 5Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 1…Uitvoer-tokens: 42,068Redeneer-tokens: 26,784Responstijd: gem. 12.66s · totaal 126.62s · max 46.35s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)35.76sResponstijd (max)35.76sResponstijd (totaal)35.76s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)46.35sResponstijd (max)46.35sResponstijd (totaal)46.35s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.90sResponstijd (max)13.90sResponstijd (totaal)13.90s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.94sResponstijd (max)4.94sResponstijd (totaal)4.94s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.61sResponstijd (max)2.61sResponstijd (totaal)2.61s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.80sResponstijd (max)5.22sResponstijd (totaal)9.60s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.48sResponstijd (max)7.48sResponstijd (totaal)7.48s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 79.6%Instabiele tests: 4…Uitvoer-tokens: 7,554Redeneer-tokens: 45,588Responstijd: gem. 43.49s · totaal 782.73s · max 180.92s
Anti-AI-trucs
: 8.4 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)30.72sResponstijd (max)44.23sResponstijd (totaal)122.88s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)180.92sResponstijd (max)180.92sResponstijd (totaal)180.92s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)93.11sResponstijd (max)93.11sResponstijd (totaal)93.11s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)36.09sResponstijd (max)39.12sResponstijd (totaal)72.18s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)21.78sResponstijd (max)30.66sResponstijd (totaal)65.35s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)35.78sResponstijd (max)47.30sResponstijd (totaal)71.56s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)36.87sResponstijd (max)59.22sResponstijd (totaal)110.62s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)34.81sResponstijd (max)34.81sResponstijd (totaal)34.81s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 3…Uitvoer-tokens: 17,346Redeneer-tokens: 0Responstijd: gem. 6.84s · totaal 123.17s · max 38.52s
Anti-AI-trucs
: 8.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.40sResponstijd (max)4.78sResponstijd (totaal)13.59s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.97sResponstijd (max)8.97sResponstijd (totaal)8.97s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.12sResponstijd (max)9.12sResponstijd (totaal)9.12s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.05sResponstijd (max)3.33sResponstijd (totaal)6.10s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)17.78sResponstijd (max)38.52sResponstijd (totaal)53.33s
Instructies opvolgen
: 7.5 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)5.46sResponstijd (max)6.45sResponstijd (totaal)10.92s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)4.42sResponstijd (max)5.04sResponstijd (totaal)13.27s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.68sResponstijd (max)4.68sResponstijd (totaal)4.68s
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 70.4%Instabiele tests: 1…Uitvoer-tokens: 5,361Redeneer-tokens: 0Responstijd: gem. 1.30s · totaal 23.42s · max 3.39s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.47sResponstijd (max)1.47sResponstijd (totaal)1.47s
Gecombineerd
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.20sResponstijd (max)3.20sResponstijd (totaal)3.20s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.22sResponstijd (max)1.33sResponstijd (totaal)2.44s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)942msResponstijd (max)1.12sResponstijd (totaal)2.83s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.13sResponstijd (max)1.14sResponstijd (totaal)2.27s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)972msResponstijd (max)1.13sResponstijd (totaal)2.92s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.39sResponstijd (max)3.39sResponstijd (totaal)3.39s
Totaal tests: 17Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 70.6%Instabiele tests: 2…Uitvoer-tokens: 71,904Redeneer-tokens: 155,607Responstijd: gem. 26.78s · totaal 294.58s · max 170.45s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.56sResponstijd (max)32.30sResponstijd (totaal)40.68s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)29.57sResponstijd (max)29.57sResponstijd (totaal)29.57s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.01sResponstijd (max)15.01sResponstijd (totaal)15.01s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)170.45sResponstijd (max)170.45sResponstijd (totaal)170.45s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.91sResponstijd (max)11.91sResponstijd (totaal)11.91s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 79.6%Instabiele tests: 5…Uitvoer-tokens: 1,757Redeneer-tokens: 55,907Responstijd: gem. 47.47s · totaal 854.45s · max 255.28s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)28.51sResponstijd (max)39.73sResponstijd (totaal)114.05s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)62.48sResponstijd (max)62.48sResponstijd (totaal)62.48s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)76.57sResponstijd (max)76.57sResponstijd (totaal)76.57s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)28.03sResponstijd (max)30.49sResponstijd (totaal)56.07s
Domeinspecifiek
: 4.1 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)112.69sResponstijd (max)255.28sResponstijd (totaal)338.07s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.36sResponstijd (max)19.53sResponstijd (totaal)30.73s
Puzzeloplossing
: 6.4 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 2Responstijd (gem.)25.53sResponstijd (max)32.37sResponstijd (totaal)76.60s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)74.73sResponstijd (max)74.73sResponstijd (totaal)74.73s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 77.8%Instabiele tests: 6…Uitvoer-tokens: 2,351Redeneer-tokens: 58,941Responstijd: gem. 14.96s · totaal 269.32s · max 67.08s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.78sResponstijd (max)13.78sResponstijd (totaal)13.78s
Gecombineerd
: 6.9 Een test is alleen volledig geslaagd als alle runs slagen.Ongeldige toolaanroep: 1Responstijd (gem.)15.06sResponstijd (max)15.06sResponstijd (totaal)15.06s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.60sResponstijd (max)9.92sResponstijd (totaal)19.19s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)38.15sResponstijd (max)67.08sResponstijd (totaal)114.45s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.09sResponstijd (max)11.09sResponstijd (totaal)11.09s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.74sResponstijd (max)5.23sResponstijd (totaal)7.47s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)10.91sResponstijd (max)18.97sResponstijd (totaal)32.74s
Toolaanroepen
: 7.0 Een test is alleen volledig geslaagd als alle runs slagen.Ongeldige toolaanroep: 1Responstijd (gem.)12.53sResponstijd (max)12.53sResponstijd (totaal)12.53s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 81.5%Instabiele tests: 6…Uitvoer-tokens: 2,073Redeneer-tokens: 191,899Responstijd: gem. 66.72s · totaal 1201.03s · max 234.29s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)59.11sResponstijd (max)168.31sResponstijd (totaal)236.44s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)45.75sResponstijd (max)45.75sResponstijd (totaal)45.75s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.78sResponstijd (max)17.78sResponstijd (totaal)17.78s
Gegevensparsering en extractie
: 7.3 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)56.99sResponstijd (max)80.14sResponstijd (totaal)113.98s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)146.50sResponstijd (max)234.29sResponstijd (totaal)439.49s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)63.49sResponstijd (max)111.61sResponstijd (totaal)126.98s
Puzzeloplossing
: 6.4 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 2Responstijd (gem.)56.74sResponstijd (max)115.01sResponstijd (totaal)170.23s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)10.33sResponstijd (max)10.33sResponstijd (totaal)10.33s
Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Time-out: 2API-fout: 1Responstijd (gem.)24.13sResponstijd (max)118.52sResponstijd (totaal)410.25s…
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 75.9%Instabiele tests: 3…Uitvoer-tokens: 8,005Redeneer-tokens: 49,090Responstijd: gem. 24.13s · totaal 410.25s · max 118.52s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.31sResponstijd (max)14.20sResponstijd (totaal)33.24s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)118.52sResponstijd (max)118.52sResponstijd (totaal)118.52s
Gecombineerd
: 9.5 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)43.11sResponstijd (max)43.11sResponstijd (totaal)43.11s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.33sResponstijd (max)9.40sResponstijd (totaal)18.66s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)29.77sResponstijd (max)32.22sResponstijd (totaal)89.30s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)20.95sResponstijd (max)20.95sResponstijd (totaal)20.95s
Instructies opvolgen
: 6.4 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)7.47sResponstijd (max)10.16sResponstijd (totaal)14.94s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)23.85sResponstijd (max)33.09sResponstijd (totaal)71.54s
Toolaanroepen
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 3…Uitvoer-tokens: 2,840Redeneer-tokens: 116,242Responstijd: gem. 13.71s · totaal 246.73s · max 86.93s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.98sResponstijd (max)3.76sResponstijd (totaal)7.92s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)31.48sResponstijd (max)31.48sResponstijd (totaal)31.48s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)16.86sResponstijd (max)16.86sResponstijd (totaal)16.86s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.80sResponstijd (max)1.81sResponstijd (totaal)3.60s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Geen antwoord: 1Responstijd (gem.)20.60sResponstijd (max)57.93sResponstijd (totaal)61.79s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.29sResponstijd (max)7.29sResponstijd (totaal)7.29s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 74.1%Instabiele tests: 4…Uitvoer-tokens: 80,759Redeneer-tokens: 179,814Responstijd: gem. 45.20s · totaal 768.37s · max 215.85s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)106.96sResponstijd (max)106.96sResponstijd (totaal)106.96s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)40.96sResponstijd (max)40.96sResponstijd (totaal)40.96s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)20.38sResponstijd (max)22.88sResponstijd (totaal)40.76s
Domeinspecifiek
: 5.3 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 2Responstijd (gem.)202.38sResponstijd (max)215.85sResponstijd (totaal)404.76s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.83sResponstijd (max)17.83sResponstijd (totaal)17.83s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)12.53sResponstijd (max)19.15sResponstijd (totaal)25.06s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.92sResponstijd (max)8.92sResponstijd (totaal)8.92s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 61.1%Instabiele tests: 0…Uitvoer-tokens: 928Redeneer-tokens: 72,661Responstijd: gem. 16.76s · totaal 301.61s · max 158.78s
Anti-AI-trucs
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.11sResponstijd (max)3.43sResponstijd (totaal)8.43s
Programmeren
: 4.0 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)68.55sResponstijd (max)68.55sResponstijd (totaal)68.55s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)19.29sResponstijd (max)19.29sResponstijd (totaal)19.29s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.29sResponstijd (max)2.62sResponstijd (totaal)4.58s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.86sResponstijd (max)2.86sResponstijd (totaal)2.86s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.07sResponstijd (max)11.07sResponstijd (totaal)11.07s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 68.5%Instabiele tests: 3…Uitvoer-tokens: 20,784Redeneer-tokens: 0Responstijd: gem. 5.88s · totaal 105.90s · max 18.33s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.32sResponstijd (max)9.32sResponstijd (totaal)9.32s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)11.96sResponstijd (max)11.96sResponstijd (totaal)11.96s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.21sResponstijd (max)2.52sResponstijd (totaal)4.42s
Domeinspecifiek
: 3.5 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 3Responstijd (gem.)13.01sResponstijd (max)18.33sResponstijd (totaal)39.04s
Instructies opvolgen
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.29sResponstijd (max)4.18sResponstijd (totaal)6.59s
Puzzeloplossing
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.93sResponstijd (max)3.05sResponstijd (totaal)8.78s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)8.36sResponstijd (max)8.36sResponstijd (totaal)8.36s
Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 4Verkeerd antwoord: 2Responstijd (gem.)21.08sResponstijd (max)83.40sResponstijd (totaal)231.84s…
Totaal tests: 18Foute tests: 6Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 70.4%Instabiele tests: 2…Uitvoer-tokens: 29,829Redeneer-tokens: 18,938Responstijd: gem. 21.08s · totaal 231.84s · max 83.40s
Anti-AI-trucs
: 6.4 Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 2Responstijd (gem.)7.45sResponstijd (max)11.88sResponstijd (totaal)14.90s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.11sResponstijd (max)23.11sResponstijd (totaal)23.11s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)76.66sResponstijd (max)76.66sResponstijd (totaal)76.66s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.37sResponstijd (max)7.37sResponstijd (totaal)7.37s
Algemene intelligentie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)5.04sResponstijd (max)5.04sResponstijd (totaal)5.04s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.43sResponstijd (max)2.43sResponstijd (totaal)2.43s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)4.60sResponstijd (max)4.66sResponstijd (totaal)9.20s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)9.73sResponstijd (max)9.73sResponstijd (totaal)9.73s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 68.5%Instabiele tests: 2…Uitvoer-tokens: 2,946Redeneer-tokens: 58,132Responstijd: gem. 11.21s · totaal 201.80s · max 94.06s
Anti-AI-trucs
: 8.3 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)4.52sResponstijd (max)7.74sResponstijd (totaal)18.10s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)13.41sResponstijd (max)13.41sResponstijd (totaal)13.41s
Gecombineerd
: 9.8 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)24.13sResponstijd (max)24.13sResponstijd (totaal)24.13s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)2.54sResponstijd (max)3.33sResponstijd (totaal)5.08s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)38.18sResponstijd (max)94.06sResponstijd (totaal)114.53s
Instructies opvolgen
: 9.8 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)1.88sResponstijd (max)2.61sResponstijd (totaal)3.75s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)7.71sResponstijd (max)7.71sResponstijd (totaal)7.71s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 66.7%Instabiele tests: 2…Uitvoer-tokens: 2,419Redeneer-tokens: 79,238Responstijd: gem. 69.70s · totaal 1045.47s · max 262.83s
Anti-AI-trucs
: 6.6 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)74.75sResponstijd (max)182.10sResponstijd (totaal)298.98s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)197.31sResponstijd (max)197.31sResponstijd (totaal)197.31s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)262.83sResponstijd (max)262.83sResponstijd (totaal)262.83s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)24.27sResponstijd (max)27.52sResponstijd (totaal)48.54s
Domeinspecifiek
: 3.0 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 3Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)17.47sResponstijd (max)19.46sResponstijd (totaal)34.93s
Puzzeloplossing
: 8.2 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)25.85sResponstijd (max)32.95sResponstijd (totaal)77.55s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)88.68sResponstijd (max)88.68sResponstijd (totaal)88.68s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 72.2%Instabiele tests: 4…Uitvoer-tokens: 2,705Redeneer-tokens: 18,977Responstijd: gem. 14.04s · totaal 154.41s · max 77.80s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)15.12sResponstijd (max)15.12sResponstijd (totaal)15.12s
Gecombineerd
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)14.06sResponstijd (max)14.06sResponstijd (totaal)14.06s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.15sResponstijd (max)3.15sResponstijd (totaal)3.15s
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Verkeerd antwoord: 1Responstijd (gem.)77.80sResponstijd (max)77.80sResponstijd (totaal)77.80s
Instructies opvolgen
: 9.9 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.12sResponstijd (max)3.12sResponstijd (totaal)3.12s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Instructies niet gevolgd: 1Responstijd (gem.)5.47sResponstijd (max)6.45sResponstijd (totaal)10.94s
Toolaanroepen
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Geen antwoord: 1Responstijd (gem.)10.30sResponstijd (max)10.30sResponstijd (totaal)10.30s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 70.4%Instabiele tests: 3…Uitvoer-tokens: 12,387Redeneer-tokens: 115,182Responstijd: gem. 23.36s · totaal 280.34s · max 96.01s
Anti-AI-trucs
: 8.1 Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 1Responstijd (gem.)15.85sResponstijd (max)20.83sResponstijd (totaal)47.55s
Programmeren
: 4.7 Een test is alleen volledig geslaagd als alle runs slagen.Time-out: 1Responstijd (gem.)13.03sResponstijd (max)13.03sResponstijd (totaal)13.03s
Gecombineerd
: 9.8 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)75.68sResponstijd (max)75.68sResponstijd (totaal)75.68s
Gegevensparsering en extractie
: 6.5 Een test is alleen volledig geslaagd als alle runs slagen.API-fout: 1Responstijd (gem.)0msResponstijd (max)0msResponstijd (totaal)0ms
Domeinspecifiek
: 5.9 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 2Responstijd (gem.)96.01sResponstijd (max)96.01sResponstijd (totaal)96.01s
Instructies opvolgen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.28sResponstijd (max)7.37sResponstijd (totaal)8.55s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.77sResponstijd (max)5.26sResponstijd (totaal)7.55s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)27.78sResponstijd (max)27.78sResponstijd (totaal)27.78s
Totaal tests: 18Foute tests: 7Betrouwbaarheid: n.v.t.Betrouwbaarheidstelemetrie is niet beschikbaar of onvolledig voor dit model.Slaagpercentage per poging: 64.8%Instabiele tests: 1…Uitvoer-tokens: 7,433Redeneer-tokens: 0Responstijd: gem. 4.98s · totaal 54.83s · max 23.84s
Programmeren
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.67sResponstijd (max)3.67sResponstijd (totaal)3.67s
Gecombineerd
: 9.5 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)23.84sResponstijd (max)23.84sResponstijd (totaal)23.84s
Gegevensparsering en extractie
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)3.43sResponstijd (max)3.43sResponstijd (totaal)3.43s
Domeinspecifiek
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)3.54sResponstijd (max)3.54sResponstijd (totaal)3.54s
Instructies opvolgen
: 6.5 Een test is alleen volledig geslaagd als alle runs slagen.Verkeerd antwoord: 1Responstijd (gem.)1.96sResponstijd (max)1.96sResponstijd (totaal)1.96s
Puzzeloplossing
: 7.7 Een test is alleen volledig geslaagd als alle runs slagen.Extra opmaak: 1Responstijd (gem.)2.92sResponstijd (max)3.33sResponstijd (totaal)5.84s
Toolaanroepen
: 10.0 Een test is alleen volledig geslaagd als alle runs slagen.Geen mislukte antwoorden.Responstijd (gem.)4.11sResponstijd (max)4.11sResponstijd (totaal)4.11s