8.1Wastani wa alama katika majaribio yote ya benchmark.โฆ
8.2Wastani wa alama katika majaribio yote ya benchmark.โฆ
8.4Wastani wa alama katika majaribio yote ya benchmark.โฆ
8.8Wastani wa alama katika majaribio yote ya benchmark.โฆ
Nafasi
#22
#17
#11
#5
Uthabiti
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
9.6Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
9.5Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
Majaribio sahihi
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 4Hakufuata maelekezo: 1Muda wa majibu (wastani)3.22sMuda wa majibu (upeo)11.91sMuda wa majibu (jumla)58.00sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 4Hakufuata maelekezo: 1Muda wa majibu (wastani)3.74sMuda wa majibu (upeo)14.93sMuda wa majibu (jumla)67.31sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 3Hakufuata maelekezo: 1Muda wa majibu (wastani)68.83sMuda wa majibu (upeo)280.52sMuda wa majibu (jumla)1101.32sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 3Muda wa majibu (wastani)6.01sMuda wa majibu (upeo)14.72sMuda wa majibu (jumla)108.12sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Kiwango cha kupita kwa kila jaribio
72.2%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
72.2%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
77.1%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
85.2%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
Majaribio yasiyo thabiti
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jumla ya uendeshaji
54Jumla ya uendeshajiโฆ
54Jumla ya uendeshajiโฆ
48Jumla ya uendeshajiโฆ
54Jumla ya uendeshajiโฆ
Gharama kwa matokeo
0.168Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
0.419Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
19.243Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
0.604Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
8.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
75.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)2.12sMuda wa majibu (upeo)3.18sMuda wa majibu (jumla)8.50sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
9.1Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
75.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakufuata maelekezo: 1Muda wa majibu (wastani)2.33sMuda wa majibu (upeo)3.89sMuda wa majibu (jumla)9.30sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
2.33sMuda wa majibu (wastani)โฆ
570Tokeni za matokeoโฆ
4,305Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)43.87sMuda wa majibu (upeo)121.88sMuda wa majibu (jumla)131.62sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)3.48sMuda wa majibu (upeo)4.31sMuda wa majibu (jumla)13.94sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)2.20sMuda wa majibu (upeo)2.20sMuda wa majibu (jumla)2.20sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)4.34sMuda wa majibu (upeo)4.34sMuda wa majibu (jumla)4.34sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
4.34sMuda wa majibu (wastani)โฆ
431Tokeni za matokeoโฆ
2,684Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)6.94sMuda wa majibu (upeo)6.94sMuda wa majibu (jumla)6.94sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)11.91sMuda wa majibu (upeo)11.91sMuda wa majibu (jumla)11.91sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)14.93sMuda wa majibu (upeo)14.93sMuda wa majibu (jumla)14.93sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
14.93sMuda wa majibu (wastani)โฆ
327Tokeni za matokeoโฆ
7,347Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)280.52sMuda wa majibu (upeo)280.52sMuda wa majibu (jumla)280.52sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)3.27sMuda wa majibu (upeo)3.27sMuda wa majibu (jumla)3.27sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)3.00sMuda wa majibu (upeo)3.74sMuda wa majibu (jumla)5.99sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)2.29sMuda wa majibu (upeo)2.31sMuda wa majibu (jumla)4.59sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
2.29sMuda wa majibu (wastani)โฆ
279Tokeni za matokeoโฆ
2,952Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)7.16sMuda wa majibu (upeo)8.54sMuda wa majibu (jumla)14.31sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)9.40sMuda wa majibu (upeo)14.72sMuda wa majibu (jumla)18.80sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
5.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
33.3%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 2Muda wa majibu (wastani)2.36sMuda wa majibu (upeo)3.51sMuda wa majibu (jumla)7.07sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 3Muda wa majibu (wastani)4.21sMuda wa majibu (upeo)5.86sMuda wa majibu (jumla)12.62sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
4.21sMuda wa majibu (wastani)โฆ
18Tokeni za matokeoโฆ
5,325Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
5.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
33.3%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 2Muda wa majibu (wastani)127.58sMuda wa majibu (upeo)133.93sMuda wa majibu (jumla)382.74sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
5.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
7.2Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
44.4%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 2Muda wa majibu (wastani)8.05sMuda wa majibu (upeo)14.40sMuda wa majibu (jumla)24.15sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
4.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakufuata maelekezo: 1Muda wa majibu (wastani)1.54sMuda wa majibu (upeo)1.54sMuda wa majibu (jumla)1.54sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)3.16sMuda wa majibu (upeo)3.16sMuda wa majibu (jumla)3.16sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.16sMuda wa majibu (wastani)โฆ
96Tokeni za matokeoโฆ
1,488Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)5.25sMuda wa majibu (upeo)5.25sMuda wa majibu (jumla)5.25sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)3.68sMuda wa majibu (upeo)3.68sMuda wa majibu (jumla)3.68sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)1.49sMuda wa majibu (upeo)1.66sMuda wa majibu (jumla)2.99sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)1.91sMuda wa majibu (upeo)1.93sMuda wa majibu (jumla)3.82sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
1.91sMuda wa majibu (wastani)โฆ
72Tokeni za matokeoโฆ
2,121Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
7.9Wastani wa alama katika majaribio yote ya benchmark.โฆ
6.9Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakufuata maelekezo: 1Muda wa majibu (wastani)70.07sMuda wa majibu (upeo)136.53sMuda wa majibu (jumla)140.14sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
9.9Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)7.02sMuda wa majibu (upeo)7.35sMuda wa majibu (jumla)14.03sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)2.76sMuda wa majibu (upeo)5.08sMuda wa majibu (jumla)8.27sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
7.7Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)3.58sMuda wa majibu (upeo)4.41sMuda wa majibu (jumla)10.75sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.58sMuda wa majibu (wastani)โฆ
141Tokeni za matokeoโฆ
1,896Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
7.7Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)46.33sMuda wa majibu (upeo)134.22sMuda wa majibu (jumla)139.00sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)6.11sMuda wa majibu (upeo)10.27sMuda wa majibu (jumla)18.32sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)9.54sMuda wa majibu (upeo)9.54sMuda wa majibu (jumla)9.54sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)3.80sMuda wa majibu (upeo)3.80sMuda wa majibu (jumla)3.80sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.80sMuda wa majibu (wastani)โฆ
234Tokeni za matokeoโฆ
912Tokeni za hojaโฆ
Gemini 3.1 Flash Lite PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)7.73sMuda wa majibu (upeo)7.73sMuda wa majibu (jumla)7.73sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)4.99sMuda wa majibu (upeo)4.99sMuda wa majibu (jumla)4.99sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ