Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 3Răspuns greșit: 3Timp de răspuns (mediu)9.81sTimp de răspuns (maxim)31.36sTimp de răspuns (total)176.62s…
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 74.1%Teste instabile: 2…Tokenuri de ieșire: 1,568Tokenuri de raționament: 91,909Timp de răspuns: medie 9.81s · total 176.62s · maxim 31.36s
Trucuri anti-AI
: 8.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.16sTimp de răspuns (maxim)3.44sTimp de răspuns (total)12.65s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)31.36sTimp de răspuns (maxim)31.36sTimp de răspuns (total)31.36s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)20.93sTimp de răspuns (maxim)20.93sTimp de răspuns (total)20.93s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.01sTimp de răspuns (maxim)4.27sTimp de răspuns (total)8.02s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)21.33sTimp de răspuns (maxim)24.21sTimp de răspuns (total)64.00s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)5.78sTimp de răspuns (maxim)5.78sTimp de răspuns (total)5.78s
Rezolvare de puzzle-uri
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)3.85sTimp de răspuns (maxim)4.53sTimp de răspuns (total)11.55s
Apelare instrumente
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)12.39sTimp de răspuns (maxim)12.39sTimp de răspuns (total)12.39s
Total teste: 18Teste greșite: 5Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 74.1%Teste instabile: 1…Tokenuri de ieșire: 42,068Tokenuri de raționament: 26,784Timp de răspuns: medie 12.66s · total 126.62s · maxim 46.35s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)35.76sTimp de răspuns (maxim)35.76sTimp de răspuns (total)35.76s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)46.35sTimp de răspuns (maxim)46.35sTimp de răspuns (total)46.35s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)13.90sTimp de răspuns (maxim)13.90sTimp de răspuns (total)13.90s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.94sTimp de răspuns (maxim)4.94sTimp de răspuns (total)4.94s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.61sTimp de răspuns (maxim)2.61sTimp de răspuns (total)2.61s
Rezolvare de puzzle-uri
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.80sTimp de răspuns (maxim)5.22sTimp de răspuns (total)9.60s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)7.48sTimp de răspuns (maxim)7.48sTimp de răspuns (total)7.48s
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 79.6%Teste instabile: 4…Tokenuri de ieșire: 7,554Tokenuri de raționament: 45,588Timp de răspuns: medie 43.49s · total 782.73s · maxim 180.92s
Trucuri anti-AI
: 8.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)30.72sTimp de răspuns (maxim)44.23sTimp de răspuns (total)122.88s
Programare
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)180.92sTimp de răspuns (maxim)180.92sTimp de răspuns (total)180.92s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)93.11sTimp de răspuns (maxim)93.11sTimp de răspuns (total)93.11s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)36.09sTimp de răspuns (maxim)39.12sTimp de răspuns (total)72.18s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)21.78sTimp de răspuns (maxim)30.66sTimp de răspuns (total)65.35s
Inteligență generală
: 5.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)31.30sTimp de răspuns (maxim)31.30sTimp de răspuns (total)31.30s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)35.78sTimp de răspuns (maxim)47.30sTimp de răspuns (total)71.56s
Rezolvare de puzzle-uri
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)36.87sTimp de răspuns (maxim)59.22sTimp de răspuns (total)110.62s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)34.81sTimp de răspuns (maxim)34.81sTimp de răspuns (total)34.81s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 5Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)6.84sTimp de răspuns (maxim)38.52sTimp de răspuns (total)123.17s…
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 75.9%Teste instabile: 3…Tokenuri de ieșire: 17,346Tokenuri de raționament: 0Timp de răspuns: medie 6.84s · total 123.17s · maxim 38.52s
Trucuri anti-AI
: 8.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.40sTimp de răspuns (maxim)4.78sTimp de răspuns (total)13.59s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)8.97sTimp de răspuns (maxim)8.97sTimp de răspuns (total)8.97s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)9.12sTimp de răspuns (maxim)9.12sTimp de răspuns (total)9.12s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.05sTimp de răspuns (maxim)3.33sTimp de răspuns (total)6.10s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)17.78sTimp de răspuns (maxim)38.52sTimp de răspuns (total)53.33s
Inteligență generală
: 4.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)3.20sTimp de răspuns (maxim)3.20sTimp de răspuns (total)3.20s
Respectarea instrucțiunilor
: 7.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)5.46sTimp de răspuns (maxim)6.45sTimp de răspuns (total)10.92s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)4.42sTimp de răspuns (maxim)5.04sTimp de răspuns (total)13.27s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.68sTimp de răspuns (maxim)4.68sTimp de răspuns (total)4.68s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 4Nu a urmat instrucțiunile: 2Timp de răspuns (mediu)1.30sTimp de răspuns (maxim)3.39sTimp de răspuns (total)23.42s…
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 70.4%Teste instabile: 1…Tokenuri de ieșire: 5,361Tokenuri de raționament: 0Timp de răspuns: medie 1.30s · total 23.42s · maxim 3.39s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.47sTimp de răspuns (maxim)1.47sTimp de răspuns (total)1.47s
Combinat
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.20sTimp de răspuns (maxim)3.20sTimp de răspuns (total)3.20s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.22sTimp de răspuns (maxim)1.33sTimp de răspuns (total)2.44s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)942msTimp de răspuns (maxim)1.12sTimp de răspuns (total)2.83s
Inteligență generală
: 4.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)741msTimp de răspuns (maxim)741msTimp de răspuns (total)741ms
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.13sTimp de răspuns (maxim)1.14sTimp de răspuns (total)2.27s
Rezolvare de puzzle-uri
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)972msTimp de răspuns (maxim)1.13sTimp de răspuns (total)2.92s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.39sTimp de răspuns (maxim)3.39sTimp de răspuns (total)3.39s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 3Răspuns greșit: 3Timp de răspuns (mediu)26.78sTimp de răspuns (maxim)170.45sTimp de răspuns (total)294.58s…
Total teste: 17Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 70.6%Teste instabile: 2…Tokenuri de ieșire: 71,904Tokenuri de raționament: 155,607Timp de răspuns: medie 26.78s · total 294.58s · maxim 170.45s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)13.56sTimp de răspuns (maxim)32.30sTimp de răspuns (total)40.68s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)29.57sTimp de răspuns (maxim)29.57sTimp de răspuns (total)29.57s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)15.01sTimp de răspuns (maxim)15.01sTimp de răspuns (total)15.01s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)170.45sTimp de răspuns (maxim)170.45sTimp de răspuns (total)170.45s
Inteligență generală
: 5.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)6.54sTimp de răspuns (maxim)6.54sTimp de răspuns (total)6.54s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)11.91sTimp de răspuns (maxim)11.91sTimp de răspuns (total)11.91s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 4Nu a urmat instrucțiunile: 3Timp de răspuns (mediu)47.47sTimp de răspuns (maxim)255.28sTimp de răspuns (total)854.45s…
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 79.6%Teste instabile: 5…Tokenuri de ieșire: 1,757Tokenuri de raționament: 55,907Timp de răspuns: medie 47.47s · total 854.45s · maxim 255.28s
Trucuri anti-AI
: 8.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)28.51sTimp de răspuns (maxim)39.73sTimp de răspuns (total)114.05s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)62.48sTimp de răspuns (maxim)62.48sTimp de răspuns (total)62.48s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)76.57sTimp de răspuns (maxim)76.57sTimp de răspuns (total)76.57s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)28.03sTimp de răspuns (maxim)30.49sTimp de răspuns (total)56.07s
Specific domeniului
: 4.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp de răspuns (mediu)112.69sTimp de răspuns (maxim)255.28sTimp de răspuns (total)338.07s
Inteligență generală
: 6.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)25.15sTimp de răspuns (maxim)25.15sTimp de răspuns (total)25.15s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)15.36sTimp de răspuns (maxim)19.53sTimp de răspuns (total)30.73s
Rezolvare de puzzle-uri
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 2Timp de răspuns (mediu)25.53sTimp de răspuns (maxim)32.37sTimp de răspuns (total)76.60s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)74.73sTimp de răspuns (maxim)74.73sTimp de răspuns (total)74.73s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 77.8%Teste instabile: 6…Tokenuri de ieșire: 2,351Tokenuri de raționament: 58,941Timp de răspuns: medie 14.96s · total 269.32s · maxim 67.08s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)13.78sTimp de răspuns (maxim)13.78sTimp de răspuns (total)13.78s
Combinat
: 6.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Apel de instrument invalid: 1Timp de răspuns (mediu)15.06sTimp de răspuns (maxim)15.06sTimp de răspuns (total)15.06s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)9.60sTimp de răspuns (maxim)9.92sTimp de răspuns (total)19.19s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)38.15sTimp de răspuns (maxim)67.08sTimp de răspuns (total)114.45s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)11.09sTimp de răspuns (maxim)11.09sTimp de răspuns (total)11.09s
Respectarea instrucțiunilor
: 9.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.74sTimp de răspuns (maxim)5.23sTimp de răspuns (total)7.47s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)10.91sTimp de răspuns (maxim)18.97sTimp de răspuns (total)32.74s
Apelare instrumente
: 7.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Apel de instrument invalid: 1Timp de răspuns (mediu)12.53sTimp de răspuns (maxim)12.53sTimp de răspuns (total)12.53s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 81.5%Teste instabile: 6…Tokenuri de ieșire: 2,073Tokenuri de raționament: 191,899Timp de răspuns: medie 66.72s · total 1201.03s · maxim 234.29s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)59.11sTimp de răspuns (maxim)168.31sTimp de răspuns (total)236.44s
Programare
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)45.75sTimp de răspuns (maxim)45.75sTimp de răspuns (total)45.75s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.78sTimp de răspuns (maxim)17.78sTimp de răspuns (total)17.78s
Parsare și extragere de date
: 7.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)56.99sTimp de răspuns (maxim)80.14sTimp de răspuns (total)113.98s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)146.50sTimp de răspuns (maxim)234.29sTimp de răspuns (total)439.49s
Inteligență generală
: 6.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)40.05sTimp de răspuns (maxim)40.05sTimp de răspuns (total)40.05s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)63.49sTimp de răspuns (maxim)111.61sTimp de răspuns (total)126.98s
Rezolvare de puzzle-uri
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 2Timp de răspuns (mediu)56.74sTimp de răspuns (maxim)115.01sTimp de răspuns (total)170.23s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)10.33sTimp de răspuns (maxim)10.33sTimp de răspuns (total)10.33s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp expirat: 2Eroare API: 1Timp de răspuns (mediu)24.13sTimp de răspuns (maxim)118.52sTimp de răspuns (total)410.25s…
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 75.9%Teste instabile: 3…Tokenuri de ieșire: 8,005Tokenuri de raționament: 49,090Timp de răspuns: medie 24.13s · total 410.25s · maxim 118.52s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)8.31sTimp de răspuns (maxim)14.20sTimp de răspuns (total)33.24s
Programare
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)118.52sTimp de răspuns (maxim)118.52sTimp de răspuns (total)118.52s
Combinat
: 9.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)43.11sTimp de răspuns (maxim)43.11sTimp de răspuns (total)43.11s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)9.33sTimp de răspuns (maxim)9.40sTimp de răspuns (total)18.66s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)29.77sTimp de răspuns (maxim)32.22sTimp de răspuns (total)89.30s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)20.95sTimp de răspuns (maxim)20.95sTimp de răspuns (total)20.95s
Respectarea instrucțiunilor
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)7.47sTimp de răspuns (maxim)10.16sTimp de răspuns (total)14.94s
Rezolvare de puzzle-uri
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)23.85sTimp de răspuns (maxim)33.09sTimp de răspuns (total)71.54s
Apelare instrumente
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 74.1%Teste instabile: 3…Tokenuri de ieșire: 2,840Tokenuri de raționament: 116,242Timp de răspuns: medie 13.71s · total 246.73s · maxim 86.93s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.98sTimp de răspuns (maxim)3.76sTimp de răspuns (total)7.92s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)31.48sTimp de răspuns (maxim)31.48sTimp de răspuns (total)31.48s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)16.86sTimp de răspuns (maxim)16.86sTimp de răspuns (total)16.86s
Inteligență generală
: 3.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)1.55sTimp de răspuns (maxim)1.55sTimp de răspuns (total)1.55s
Respectarea instrucțiunilor
: 9.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.80sTimp de răspuns (maxim)1.81sTimp de răspuns (total)3.60s
Rezolvare de puzzle-uri
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Fără răspuns: 1Timp de răspuns (mediu)20.60sTimp de răspuns (maxim)57.93sTimp de răspuns (total)61.79s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)7.29sTimp de răspuns (maxim)7.29sTimp de răspuns (total)7.29s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 74.1%Teste instabile: 4…Tokenuri de ieșire: 80,759Tokenuri de raționament: 179,814Timp de răspuns: medie 45.20s · total 768.37s · maxim 215.85s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)106.96sTimp de răspuns (maxim)106.96sTimp de răspuns (total)106.96s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)40.96sTimp de răspuns (maxim)40.96sTimp de răspuns (total)40.96s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)20.38sTimp de răspuns (maxim)22.88sTimp de răspuns (total)40.76s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 2Timp de răspuns (mediu)202.38sTimp de răspuns (maxim)215.85sTimp de răspuns (total)404.76s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.83sTimp de răspuns (maxim)17.83sTimp de răspuns (total)17.83s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)12.53sTimp de răspuns (maxim)19.15sTimp de răspuns (total)25.06s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)8.92sTimp de răspuns (maxim)8.92sTimp de răspuns (total)8.92s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 61.1%Teste instabile: 0…Tokenuri de ieșire: 928Tokenuri de raționament: 72,661Timp de răspuns: medie 16.76s · total 301.61s · maxim 158.78s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.11sTimp de răspuns (maxim)3.43sTimp de răspuns (total)8.43s
Programare
: 4.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)68.55sTimp de răspuns (maxim)68.55sTimp de răspuns (total)68.55s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)19.29sTimp de răspuns (maxim)19.29sTimp de răspuns (total)19.29s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.29sTimp de răspuns (maxim)2.62sTimp de răspuns (total)4.58s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.86sTimp de răspuns (maxim)2.86sTimp de răspuns (total)2.86s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)11.07sTimp de răspuns (maxim)11.07sTimp de răspuns (total)11.07s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 5Nu a urmat instrucțiunile: 2Timp de răspuns (mediu)5.88sTimp de răspuns (maxim)18.33sTimp de răspuns (total)105.90s…
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 68.5%Teste instabile: 3…Tokenuri de ieșire: 20,784Tokenuri de raționament: 0Timp de răspuns: medie 5.88s · total 105.90s · maxim 18.33s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)9.32sTimp de răspuns (maxim)9.32sTimp de răspuns (total)9.32s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)11.96sTimp de răspuns (maxim)11.96sTimp de răspuns (total)11.96s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.21sTimp de răspuns (maxim)2.52sTimp de răspuns (total)4.42s
Specific domeniului
: 3.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp de răspuns (mediu)13.01sTimp de răspuns (maxim)18.33sTimp de răspuns (total)39.04s
Inteligență generală
: 4.6 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)1.99sTimp de răspuns (maxim)1.99sTimp de răspuns (total)1.99s
Respectarea instrucțiunilor
: 8.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.29sTimp de răspuns (maxim)4.18sTimp de răspuns (total)6.59s
Rezolvare de puzzle-uri
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.93sTimp de răspuns (maxim)3.05sTimp de răspuns (total)8.78s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)8.36sTimp de răspuns (maxim)8.36sTimp de răspuns (total)8.36s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Formatare suplimentară: 4Răspuns greșit: 2Timp de răspuns (mediu)21.08sTimp de răspuns (maxim)83.40sTimp de răspuns (total)231.84s…
Total teste: 18Teste greșite: 6Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 70.4%Teste instabile: 2…Tokenuri de ieșire: 29,829Tokenuri de raționament: 18,938Timp de răspuns: medie 21.08s · total 231.84s · maxim 83.40s
Trucuri anti-AI
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Formatare suplimentară: 2Timp de răspuns (mediu)7.45sTimp de răspuns (maxim)11.88sTimp de răspuns (total)14.90s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)23.11sTimp de răspuns (maxim)23.11sTimp de răspuns (total)23.11s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)76.66sTimp de răspuns (maxim)76.66sTimp de răspuns (total)76.66s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)7.37sTimp de răspuns (maxim)7.37sTimp de răspuns (total)7.37s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)5.04sTimp de răspuns (maxim)5.04sTimp de răspuns (total)5.04s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.43sTimp de răspuns (maxim)2.43sTimp de răspuns (total)2.43s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)4.60sTimp de răspuns (maxim)4.66sTimp de răspuns (total)9.20s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)9.73sTimp de răspuns (maxim)9.73sTimp de răspuns (total)9.73s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 4Nu a urmat instrucțiunile: 3Timp de răspuns (mediu)11.21sTimp de răspuns (maxim)94.06sTimp de răspuns (total)201.80s…
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 68.5%Teste instabile: 2…Tokenuri de ieșire: 2,946Tokenuri de raționament: 58,132Timp de răspuns: medie 11.21s · total 201.80s · maxim 94.06s
Trucuri anti-AI
: 8.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)4.52sTimp de răspuns (maxim)7.74sTimp de răspuns (total)18.10s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)13.41sTimp de răspuns (maxim)13.41sTimp de răspuns (total)13.41s
Combinat
: 9.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)24.13sTimp de răspuns (maxim)24.13sTimp de răspuns (total)24.13s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.54sTimp de răspuns (maxim)3.33sTimp de răspuns (total)5.08s
Specific domeniului
: 5.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)38.18sTimp de răspuns (maxim)94.06sTimp de răspuns (total)114.53s
Inteligență generală
: 4.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)4.15sTimp de răspuns (maxim)4.15sTimp de răspuns (total)4.15s
Respectarea instrucțiunilor
: 9.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.88sTimp de răspuns (maxim)2.61sTimp de răspuns (total)3.75s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)7.71sTimp de răspuns (maxim)7.71sTimp de răspuns (total)7.71s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 66.7%Teste instabile: 2…Tokenuri de ieșire: 2,419Tokenuri de raționament: 79,238Timp de răspuns: medie 69.70s · total 1045.47s · maxim 262.83s
Trucuri anti-AI
: 6.6 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)74.75sTimp de răspuns (maxim)182.10sTimp de răspuns (total)298.98s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)197.31sTimp de răspuns (maxim)197.31sTimp de răspuns (total)197.31s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)262.83sTimp de răspuns (maxim)262.83sTimp de răspuns (total)262.83s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)24.27sTimp de răspuns (maxim)27.52sTimp de răspuns (total)48.54s
Specific domeniului
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 3Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Inteligență generală
: 5.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)36.65sTimp de răspuns (maxim)36.65sTimp de răspuns (total)36.65s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.47sTimp de răspuns (maxim)19.46sTimp de răspuns (total)34.93s
Rezolvare de puzzle-uri
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)25.85sTimp de răspuns (maxim)32.95sTimp de răspuns (total)77.55s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)88.68sTimp de răspuns (maxim)88.68sTimp de răspuns (total)88.68s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 72.2%Teste instabile: 4…Tokenuri de ieșire: 2,705Tokenuri de raționament: 18,977Timp de răspuns: medie 14.04s · total 154.41s · maxim 77.80s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)15.12sTimp de răspuns (maxim)15.12sTimp de răspuns (total)15.12s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)14.06sTimp de răspuns (maxim)14.06sTimp de răspuns (total)14.06s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.15sTimp de răspuns (maxim)3.15sTimp de răspuns (total)3.15s
Specific domeniului
: 5.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)77.80sTimp de răspuns (maxim)77.80sTimp de răspuns (total)77.80s
Inteligență generală
: 3.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)4.32sTimp de răspuns (maxim)4.32sTimp de răspuns (total)4.32s
Respectarea instrucțiunilor
: 9.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.12sTimp de răspuns (maxim)3.12sTimp de răspuns (total)3.12s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)5.47sTimp de răspuns (maxim)6.45sTimp de răspuns (total)10.94s
Apelare instrumente
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Fără răspuns: 1Timp de răspuns (mediu)10.30sTimp de răspuns (maxim)10.30sTimp de răspuns (total)10.30s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 70.4%Teste instabile: 3…Tokenuri de ieșire: 12,387Tokenuri de raționament: 115,182Timp de răspuns: medie 23.36s · total 280.34s · maxim 96.01s
Trucuri anti-AI
: 8.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Formatare suplimentară: 1Timp de răspuns (mediu)15.85sTimp de răspuns (maxim)20.83sTimp de răspuns (total)47.55s
Programare
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)13.03sTimp de răspuns (maxim)13.03sTimp de răspuns (total)13.03s
Combinat
: 9.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)75.68sTimp de răspuns (maxim)75.68sTimp de răspuns (total)75.68s
Parsare și extragere de date
: 6.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Specific domeniului
: 5.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)96.01sTimp de răspuns (maxim)96.01sTimp de răspuns (total)96.01s
Inteligență generală
: 4.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)4.20sTimp de răspuns (maxim)4.20sTimp de răspuns (total)4.20s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.28sTimp de răspuns (maxim)7.37sTimp de răspuns (total)8.55s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.77sTimp de răspuns (maxim)5.26sTimp de răspuns (total)7.55s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)27.78sTimp de răspuns (maxim)27.78sTimp de răspuns (total)27.78s
Total teste: 18Teste greșite: 7Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 64.8%Teste instabile: 1…Tokenuri de ieșire: 7,433Tokenuri de raționament: 0Timp de răspuns: medie 4.98s · total 54.83s · maxim 23.84s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.67sTimp de răspuns (maxim)3.67sTimp de răspuns (total)3.67s
Combinat
: 9.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)23.84sTimp de răspuns (maxim)23.84sTimp de răspuns (total)23.84s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.43sTimp de răspuns (maxim)3.43sTimp de răspuns (total)3.43s
Specific domeniului
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.54sTimp de răspuns (maxim)3.54sTimp de răspuns (total)3.54s
Inteligență generală
: 6.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)2.56sTimp de răspuns (maxim)2.56sTimp de răspuns (total)2.56s
Respectarea instrucțiunilor
: 6.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)1.96sTimp de răspuns (maxim)1.96sTimp de răspuns (total)1.96s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Formatare suplimentară: 1Timp de răspuns (mediu)2.92sTimp de răspuns (maxim)3.33sTimp de răspuns (total)5.84s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.11sTimp de răspuns (maxim)4.11sTimp de răspuns (total)4.11s
Total teste: 18Teste greșite: 8Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 79.6%Teste instabile: 7…Tokenuri de ieșire: 10,137Tokenuri de raționament: 208,761Timp de răspuns: medie 44.51s · total 801.21s · maxim 106.00s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)21.13sTimp de răspuns (maxim)34.96sTimp de răspuns (total)84.53s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)79.09sTimp de răspuns (maxim)79.09sTimp de răspuns (total)79.09s
Combinat
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Fără răspuns: 1Timp de răspuns (mediu)75.34sTimp de răspuns (maxim)75.34sTimp de răspuns (total)75.34s
Parsare și extragere de date
: 7.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)59.33sTimp de răspuns (maxim)97.12sTimp de răspuns (total)118.65s
Specific domeniului
: 4.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 2Răspuns greșit: 1Timp de răspuns (mediu)88.34sTimp de răspuns (maxim)106.00sTimp de răspuns (total)265.01s
Inteligență generală
: 2.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)30.30sTimp de răspuns (maxim)30.30sTimp de răspuns (total)30.30s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)24.45sTimp de răspuns (maxim)43.36sTimp de răspuns (total)48.89s
Rezolvare de puzzle-uri
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Răspuns greșit: 1Timp de răspuns (mediu)31.58sTimp de răspuns (maxim)60.18sTimp de răspuns (total)94.75s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.65sTimp de răspuns (maxim)4.65sTimp de răspuns (total)4.65s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 5Răspuns greșit: 4Timp de răspuns (mediu)15.22sTimp de răspuns (maxim)102.91sTimp de răspuns (total)273.90s…
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 70.4%Teste instabile: 6…Tokenuri de ieșire: 2,131Tokenuri de raționament: 59,567Timp de răspuns: medie 15.22s · total 273.90s · maxim 102.91s
Trucuri anti-AI
: 8.6 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)4.05sTimp de răspuns (maxim)6.69sTimp de răspuns (total)16.20s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)7.76sTimp de răspuns (maxim)7.76sTimp de răspuns (total)7.76s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.81sTimp de răspuns (maxim)17.81sTimp de răspuns (total)17.81s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.43sTimp de răspuns (maxim)3.39sTimp de răspuns (total)4.87s
Specific domeniului
: 4.1 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp de răspuns (mediu)65.31sTimp de răspuns (maxim)102.91sTimp de răspuns (total)195.92s
Inteligență generală
: 4.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)3.72sTimp de răspuns (maxim)3.72sTimp de răspuns (total)3.72s
Rezolvare de puzzle-uri
: 6.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 2Timp de răspuns (mediu)4.33sTimp de răspuns (maxim)7.27sTimp de răspuns (total)13.00s
Apelare instrumente
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)9.62sTimp de răspuns (maxim)9.62sTimp de răspuns (total)9.62s
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 61.1%Teste instabile: 3…Tokenuri de ieșire: 6,379Tokenuri de raționament: 53,482Timp de răspuns: medie 23.98s · total 431.56s · maxim 88.15s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)23.18sTimp de răspuns (maxim)23.18sTimp de răspuns (total)23.18s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)88.15sTimp de răspuns (maxim)88.15sTimp de răspuns (total)88.15s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)12.58sTimp de răspuns (maxim)13.87sTimp de răspuns (total)25.16s
Specific domeniului
: 3.6 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp expirat: 1Timp de răspuns (mediu)44.63sTimp de răspuns (maxim)82.55sTimp de răspuns (total)133.89s
Inteligență generală
: 4.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)13.50sTimp de răspuns (maxim)13.50sTimp de răspuns (total)13.50s
Respectarea instrucțiunilor
: 8.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)15.66sTimp de răspuns (maxim)21.80sTimp de răspuns (total)31.32s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)18.64sTimp de răspuns (maxim)18.64sTimp de răspuns (total)18.64s
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 72.2%Teste instabile: 7…Tokenuri de ieșire: 42,176Tokenuri de raționament: 84,870Timp de răspuns: medie 72.43s · total 796.70s · maxim 150.77s
Trucuri anti-AI
: 7.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Fără răspuns: 1Răspuns greșit: 1Timp de răspuns (mediu)51.38sTimp de răspuns (maxim)85.28sTimp de răspuns (total)102.75s
Programare
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)150.77sTimp de răspuns (maxim)150.77sTimp de răspuns (total)150.77s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)71.37sTimp de răspuns (maxim)71.37sTimp de răspuns (total)71.37s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)49.78sTimp de răspuns (maxim)49.78sTimp de răspuns (total)49.78s
Specific domeniului
: 3.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp expirat: 1Timp de răspuns (mediu)137.29sTimp de răspuns (maxim)137.29sTimp de răspuns (total)137.29s
Inteligență generală
: 6.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)69.73sTimp de răspuns (maxim)69.73sTimp de răspuns (total)69.73s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)92.47sTimp de răspuns (maxim)92.47sTimp de răspuns (total)92.47s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)31.74sTimp de răspuns (maxim)31.74sTimp de răspuns (total)31.74s
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 66.7%Teste instabile: 5…Tokenuri de ieșire: 1,744Tokenuri de raționament: 109,882Timp de răspuns: medie 10.33s · total 185.87s · maxim 29.87s
Trucuri anti-AI
: 8.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.36sTimp de răspuns (maxim)4.08sTimp de răspuns (total)13.42s
Programare
: 4.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)24.33sTimp de răspuns (maxim)24.33sTimp de răspuns (total)24.33s
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.40sTimp de răspuns (maxim)17.40sTimp de răspuns (total)17.40s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.17sTimp de răspuns (maxim)5.02sTimp de răspuns (total)8.34s
Inteligență generală
: 5.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)7.09sTimp de răspuns (maxim)7.09sTimp de răspuns (total)7.09s
Respectarea instrucțiunilor
: 7.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)4.42sTimp de răspuns (maxim)4.46sTimp de răspuns (total)8.84s
Rezolvare de puzzle-uri
: 6.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 2Timp de răspuns (mediu)3.89sTimp de răspuns (maxim)4.90sTimp de răspuns (total)11.67s
Apelare instrumente
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)13.68sTimp de răspuns (maxim)13.68sTimp de răspuns (total)13.68s
Total teste: 18Teste greșite: 8Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 55.6%Teste instabile: 0…Tokenuri de ieșire: 1,359Tokenuri de raționament: 0Timp de răspuns: medie 4.02s · total 64.33s · maxim 26.13s
Trucuri anti-AI
: 6.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)1.85sTimp de răspuns (maxim)4.45sTimp de răspuns (total)7.40s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)26.13sTimp de răspuns (maxim)26.13sTimp de răspuns (total)26.13s
Combinat
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.25sTimp de răspuns (maxim)3.02sTimp de răspuns (total)4.51s
Specific domeniului
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.22sTimp de răspuns (maxim)4.68sTimp de răspuns (total)9.67s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.09sTimp de răspuns (maxim)2.09sTimp de răspuns (total)2.09s
Respectarea instrucțiunilor
: 6.5 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)2.84sTimp de răspuns (maxim)4.45sTimp de răspuns (total)5.68s
Apelare instrumente
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 9Timp de răspuns (mediu)2.60sTimp de răspuns (maxim)6.65sTimp de răspuns (total)31.23s…
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 53.7%Teste instabile: 2…Tokenuri de ieșire: 2,461Tokenuri de raționament: 0Timp de răspuns: medie 2.60s · total 31.23s · maxim 6.65s
Trucuri anti-AI
: 4.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp de răspuns (mediu)1.91sTimp de răspuns (maxim)2.74sTimp de răspuns (total)3.82s
Programare
: 6.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)3.63sTimp de răspuns (maxim)3.63sTimp de răspuns (total)3.63s
Combinat
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)6.65sTimp de răspuns (maxim)6.65sTimp de răspuns (total)6.65s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.89sTimp de răspuns (maxim)1.89sTimp de răspuns (total)1.89s
Specific domeniului
: 5.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)1.17sTimp de răspuns (maxim)1.44sTimp de răspuns (total)2.33s
Inteligență generală
: 4.4 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)2.26sTimp de răspuns (maxim)2.26sTimp de răspuns (total)2.26s
Respectarea instrucțiunilor
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.67sTimp de răspuns (maxim)1.67sTimp de răspuns (total)1.67s
Rezolvare de puzzle-uri
: 7.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)2.82sTimp de răspuns (maxim)3.52sTimp de răspuns (total)5.65s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.33sTimp de răspuns (maxim)3.33sTimp de răspuns (total)3.33s
Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 8Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)1.83sTimp de răspuns (maxim)5.56sTimp de răspuns (total)32.86s…
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 61.1%Teste instabile: 4…Tokenuri de ieșire: 1,910Tokenuri de raționament: 0Timp de răspuns: medie 1.83s · total 32.86s · maxim 5.56s
Trucuri anti-AI
: 6.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)1.31sTimp de răspuns (maxim)2.08sTimp de răspuns (total)5.25s
Programare
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)2.05sTimp de răspuns (maxim)2.05sTimp de răspuns (total)2.05s
Combinat
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)5.56sTimp de răspuns (maxim)5.56sTimp de răspuns (total)5.56s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)1.18sTimp de răspuns (maxim)1.24sTimp de răspuns (total)2.37s
Specific domeniului
: 2.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 3Timp de răspuns (mediu)1.31sTimp de răspuns (maxim)1.39sTimp de răspuns (total)3.92s
Inteligență generală
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.41sTimp de răspuns (maxim)3.41sTimp de răspuns (total)3.41s
Respectarea instrucțiunilor
: 6.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 1Timp de răspuns (mediu)1.15sTimp de răspuns (maxim)1.19sTimp de răspuns (total)2.31s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)3.90sTimp de răspuns (maxim)3.90sTimp de răspuns (total)3.90s
Total teste: 18Teste greșite: 10Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 64.8%Teste instabile: 6…Tokenuri de ieșire: 4,724Tokenuri de raționament: 17,921Timp de răspuns: medie 10.33s · total 175.60s · maxim 30.53s
Trucuri anti-AI
: 7.3 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp de răspuns (mediu)4.75sTimp de răspuns (maxim)7.62sTimp de răspuns (total)19.00s
Programare
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Combinat
: 4.7 Un test este considerat trecut complet doar dacă toate rulările lui trec.Timp expirat: 1Timp de răspuns (mediu)30.53sTimp de răspuns (maxim)30.53sTimp de răspuns (total)30.53s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)23.16sTimp de răspuns (maxim)26.55sTimp de răspuns (total)46.33s
Inteligență generală
: 7.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)6.44sTimp de răspuns (maxim)6.44sTimp de răspuns (total)6.44s
Respectarea instrucțiunilor
: 9.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)4.18sTimp de răspuns (maxim)4.46sTimp de răspuns (total)8.36s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)17.33sTimp de răspuns (maxim)17.33sTimp de răspuns (total)17.33s
Total teste: 18Teste greșite: 9Fiabilitate: N/DTelemetria de fiabilitate este indisponibilă sau incompletă pentru acest model.Rată de trecere pe încercare: 55.6%Teste instabile: 3…Tokenuri de ieșire: 11,947Tokenuri de raționament: 29,768Timp de răspuns: medie 19.06s · total 305.04s · maxim 87.80s
Trucuri anti-AI
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)10.08sTimp de răspuns (maxim)22.30sTimp de răspuns (total)40.30s
Programare
: 3.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Eroare API: 1Timp de răspuns (mediu)0msTimp de răspuns (maxim)0msTimp de răspuns (total)0ms
Combinat
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)87.80sTimp de răspuns (maxim)87.80sTimp de răspuns (total)87.80s
Parsare și extragere de date
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)18.16sTimp de răspuns (maxim)20.65sTimp de răspuns (total)36.33s
Specific domeniului
: 2.9 Un test este considerat trecut complet doar dacă toate rulările lui trec.Răspuns greșit: 2Timp expirat: 1Timp de răspuns (mediu)16.19sTimp de răspuns (maxim)21.56sTimp de răspuns (total)32.39s
Inteligență generală
: 3.8 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)27.86sTimp de răspuns (maxim)27.86sTimp de răspuns (total)27.86s
Respectarea instrucțiunilor
: 7.2 Un test este considerat trecut complet doar dacă toate rulările lui trec.Nu a urmat instrucțiunile: 1Timp de răspuns (mediu)7.72sTimp de răspuns (maxim)11.23sTimp de răspuns (total)15.45s
Apelare instrumente
: 10.0 Un test este considerat trecut complet doar dacă toate rulările lui trec.Niciun răspuns eșuat.Timp de răspuns (mediu)39.75sTimp de răspuns (maxim)39.75sTimp de răspuns (total)39.75s