Ulinganisho wa benchmark Qwen3.5 Plus 2026-02-15 vs Qwen3.6 Plus Preview vs GLM 5 TurboGLM 5 Turbo inaongoza kwenye Alama kwa 8.4. Qwen3.5 Plus 2026-02-15 inaongoza kwenye Uaminifu kwa 10.0. Qwen3.6 Plus Preview ina Jumla ya gharama ya chini zaidi kwa $0.000. Qwen3.6 Plus Preview ndiyo ya haraka zaidi kwa 15.25s.
Muundo unaopendekezwa: GLM 5 Turbo - It has the best score here (8.4), while responding about 1.9x faster than miundo mingine katika ulinganisho huu.
Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-18
Qwen3.6 Plus PreviewQwen3.6 Plus PreviewmediumModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.Toleo: 2026-04-20Inapatikana bure
GLM 5 TurboGLM 5 TurbomediumModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.Toleo: 2026-03-15
Qwen3.6 Plus PreviewQwen3.6 Plus PreviewmediumModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.Toleo: 2026-04-20Inapatikana bure
GLM 5 TurboGLM 5 TurbomediumModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.Toleo: 2026-03-15
Alama
8.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
5.8Wastani wa alama katika majaribio yote ya benchmark.โฆ
8.4Wastani wa alama katika majaribio yote ya benchmark.โฆ
Nafasi
#28
#113
#21
Uaminifu
10.0Alama ya mafanikio ya jaribio la kwanza: 10.0 humaanisha hakuna hitilafu za API lengwa au kikomo cha kasi zinazoweza kujaribiwa tena kabla ya miito iliyofanikiwa; hitilafu zilizorekodiwa hushusha alama.โฆ
HaipoAlama ya mafanikio ya jaribio la kwanza: 10.0 humaanisha hakuna hitilafu za API lengwa au kikomo cha kasi zinazoweza kujaribiwa tena kabla ya miito iliyofanikiwa; hitilafu zilizorekodiwa hushusha alama.โฆ
10.0Alama ya mafanikio ya jaribio la kwanza: 10.0 humaanisha hakuna hitilafu za API lengwa au kikomo cha kasi zinazoweza kujaribiwa tena kabla ya miito iliyofanikiwa; hitilafu zilizorekodiwa hushusha alama.โฆ
Uthabiti
8.8Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
9.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
8.5Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
Majaribio sahihi
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 4Muda umeisha: 2Hitilafu ya API: 1Muda wa majibu (wastani)73.79sMuda wa majibu (upeo)266.69sMuda wa majibu (jumla)1033.07sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 8Jibu lisilo sahihi: 2Muda wa majibu (wastani)15.25sMuda wa majibu (upeo)43.55sMuda wa majibu (jumla)182.96sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 4Hakufuata maelekezo: 1Hakuna jibu: 1Muda umeisha: 1Muda wa majibu (wastani)23.00sMuda wa majibu (upeo)194.23sMuda wa majibu (jumla)482.97sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
Kiwango cha kupita kwa kila jaribio
73.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
42.9%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
74.6%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
Majaribio yasiyo thabiti
3Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
4Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jumla ya uendeshaji
63Jumla ya uendeshajiโฆ
57Jumla ya uendeshajiโฆ
63Jumla ya uendeshajiโฆ
Gharama kwa matokeo
2.445Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
0.000Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
2.011Huonyesha gharama ya wastani kwa kila jibu sahihi la benchmark kwa senti (kadri ilivyo ndogo, ndivyo bora).โฆ
Jumla ya gharama
$0.310Jumla ya gharama (bei ya sasa)โฆ
$0.000Jumla ya gharama (bei ya sasa)โฆ
$0.323Jumla ya gharama (bei ya sasa)โฆ
Bei ya ingizo
$0.260 / 1MBei ya ingizoโฆ
$0.000 / 1MBei ya ingizoโฆ
$1.200 / 1MBei ya ingizoโฆ
Bei ya toleo
$1.560 / 1MBei ya toleoโฆ
$0.000 / 1MBei ya toleoโฆ
$4.000 / 1MBei ya toleoโฆ
Jumla ya tokeni za ingizo
40,918Jumla ya tokeni za ingizoโฆ
32,639Jumla ya tokeni za ingizoโฆ
35,593Jumla ya tokeni za ingizoโฆ
Tokeni za matokeo
2,159Tokeni za matokeoโฆ
1,153Tokeni za matokeoโฆ
12,245Tokeni za matokeoโฆ
Tokeni za hoja
189,604Tokeni za hojaโฆ
62,197Tokeni za hojaโฆ
62,277Tokeni za hojaโฆ
Muda wa majibu (wastani)
73.79sMuda wa majibu (wastani)โฆ
15.25sMuda wa majibu (wastani)โฆ
23.00sMuda wa majibu (wastani)โฆ
Muda wa majibu (upeo)
266.69sMuda wa majibu (upeo)โฆ
43.55sMuda wa majibu (upeo)โฆ
194.23sMuda wa majibu (upeo)โฆ
Muda wa majibu (jumla)
1033.07sMuda wa majibu (jumla)โฆ
182.96sMuda wa majibu (jumla)โฆ
482.97sMuda wa majibu (jumla)โฆ
Onyesho la kizazi
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#28 Qwen3.5 Plus 2026-02-15
medium
Gharama
$0.011
Muda
125.5s
Tokeni
7,040 tok
#113 Qwen3.6 Plus Preview
medium
Hakuna matokeo ya onyesho yaliyozalishwa kwa modeli hii bado.
8.2Wastani wa alama katika majaribio yote ya benchmark.โฆ
7.9Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
83.3%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)45.78sMuda wa majibu (upeo)81.20sMuda wa majibu (jumla)91.57sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
45.78sMuda wa majibu (wastani)โฆ
672Jumla ya tokeni za ingizoโฆ
205Tokeni za matokeoโฆ
21,236Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
8.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
75.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Muda wa majibu (wastani)11.69sMuda wa majibu (upeo)19.37sMuda wa majibu (jumla)35.08sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
11.69sMuda wa majibu (wastani)โฆ
501Jumla ya tokeni za ingizoโฆ
61Tokeni za matokeoโฆ
5,812Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)4.82sMuda wa majibu (upeo)7.69sMuda wa majibu (jumla)19.26sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
6.6Wastani wa alama katika majaribio yote ya benchmark.โฆ
7.1Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
44.4%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Jibu lisilo sahihi: 1Muda wa majibu (wastani)180.70sMuda wa majibu (upeo)266.69sMuda wa majibu (jumla)542.10sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
180.70sMuda wa majibu (wastani)โฆ
6,950Jumla ya tokeni za ingizoโฆ
420Tokeni za matokeoโฆ
80,595Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
9.8Wastani wa alama katika majaribio yote ya benchmark.โฆ
3.3Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Muda wa majibu (wastani)0msMuda wa majibu (upeo)0msMuda wa majibu (jumla)0msJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
0msMuda wa majibu (wastani)โฆ
0Jumla ya tokeni za ingizoโฆ
0Tokeni za matokeoโฆ
0Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
8.2Wastani wa alama katika majaribio yote ya benchmark.โฆ
9.3Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna jibu: 1Muda wa majibu (wastani)45.90sMuda wa majibu (upeo)95.57sMuda wa majibu (jumla)137.71sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)46.85sMuda wa majibu (upeo)46.85sMuda wa majibu (jumla)46.85sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
46.85sMuda wa majibu (wastani)โฆ
14,934Jumla ya tokeni za ingizoโฆ
421Tokeni za matokeoโฆ
7,906Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)34.95sMuda wa majibu (upeo)34.95sMuda wa majibu (jumla)34.95sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
34.95sMuda wa majibu (wastani)โฆ
14,934Jumla ya tokeni za ingizoโฆ
452Tokeni za matokeoโฆ
13,073Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)13.88sMuda wa majibu (upeo)13.88sMuda wa majibu (jumla)13.88sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)46.91sMuda wa majibu (upeo)46.91sMuda wa majibu (jumla)46.91sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
46.91sMuda wa majibu (wastani)โฆ
7,782Jumla ya tokeni za ingizoโฆ
270Tokeni za matokeoโฆ
14,916Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)14.95sMuda wa majibu (upeo)15.40sMuda wa majibu (jumla)29.90sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
14.95sMuda wa majibu (wastani)โฆ
7,782Jumla ya tokeni za ingizoโฆ
270Tokeni za matokeoโฆ
10,706Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)6.19sMuda wa majibu (upeo)6.42sMuda wa majibu (jumla)12.38sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
5.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
33.3%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Muda umeisha: 1Jibu lisilo sahihi: 1Muda wa majibu (wastani)17.50sMuda wa majibu (upeo)17.50sMuda wa majibu (jumla)17.50sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
17.50sMuda wa majibu (wastani)โฆ
444Jumla ya tokeni za ingizoโฆ
35Tokeni za matokeoโฆ
16,680Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 2Hitilafu ya API: 1Muda wa majibu (wastani)22.08sMuda wa majibu (upeo)43.55sMuda wa majibu (jumla)66.23sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
22.08sMuda wa majibu (wastani)โฆ
665Jumla ya tokeni za ingizoโฆ
49Tokeni za matokeoโฆ
26,895Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
2.9Wastani wa alama katika majaribio yote ya benchmark.โฆ
4.4Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
22.2%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
2Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 2Muda umeisha: 1Muda wa majibu (wastani)71.07sMuda wa majibu (upeo)194.23sMuda wa majibu (jumla)213.22sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
4.7Wastani wa alama katika majaribio yote ya benchmark.โฆ
1.6Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Muda umeisha: 1Muda wa majibu (wastani)79.86sMuda wa majibu (upeo)79.86sMuda wa majibu (jumla)79.86sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
79.86sMuda wa majibu (wastani)โฆ
344Jumla ya tokeni za ingizoโฆ
73Tokeni za matokeoโฆ
8,675Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Muda wa majibu (wastani)0msMuda wa majibu (upeo)0msMuda wa majibu (jumla)0msJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
0msMuda wa majibu (wastani)โฆ
0Jumla ya tokeni za ingizoโฆ
0Tokeni za matokeoโฆ
0Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
6.1Wastani wa alama katika majaribio yote ya benchmark.โฆ
3.1Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
66.7%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)10.05sMuda wa majibu (upeo)10.05sMuda wa majibu (jumla)10.05sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)31.93sMuda wa majibu (upeo)31.93sMuda wa majibu (jumla)31.93sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
31.93sMuda wa majibu (wastani)โฆ
699Jumla ya tokeni za ingizoโฆ
101Tokeni za matokeoโฆ
7,704Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
6.5Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
50.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Muda wa majibu (wastani)3.40sMuda wa majibu (upeo)3.40sMuda wa majibu (jumla)3.40sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.40sMuda wa majibu (wastani)โฆ
381Jumla ya tokeni za ingizoโฆ
27Tokeni za matokeoโฆ
1,383Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)5.38sMuda wa majibu (upeo)5.70sMuda wa majibu (jumla)10.77sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)32.50sMuda wa majibu (upeo)49.12sMuda wa majibu (jumla)65.01sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
32.50sMuda wa majibu (wastani)โฆ
696Jumla ya tokeni za ingizoโฆ
301Tokeni za matokeoโฆ
13,853Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
5.3Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
33.3%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 2Muda wa majibu (wastani)7.52sMuda wa majibu (upeo)7.52sMuda wa majibu (jumla)7.52sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
7.52sMuda wa majibu (wastani)โฆ
183Jumla ya tokeni za ingizoโฆ
27Tokeni za matokeoโฆ
2,998Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
8.7Wastani wa alama katika majaribio yote ya benchmark.โฆ
7.9Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
77.8%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
1Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakufuata maelekezo: 1Muda wa majibu (wastani)5.23sMuda wa majibu (upeo)7.26sMuda wa majibu (jumla)15.69sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)7.54sMuda wa majibu (upeo)7.54sMuda wa majibu (jumla)7.54sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
7.54sMuda wa majibu (wastani)โฆ
8,193Jumla ya tokeni za ingizoโฆ
309Tokeni za matokeoโฆ
909Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)5.87sMuda wa majibu (upeo)5.87sMuda wa majibu (jumla)5.87sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
5.87sMuda wa majibu (wastani)โฆ
8,193Jumla ya tokeni za ingizoโฆ
267Tokeni za matokeoโฆ
1,330Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
10.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
100.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hakuna majibu yaliyoshindwa.Muda wa majibu (wastani)9.84sMuda wa majibu (upeo)9.84sMuda wa majibu (jumla)9.84sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)103.81sMuda wa majibu (upeo)103.81sMuda wa majibu (jumla)103.81sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
103.81sMuda wa majibu (wastani)โฆ
204Jumla ya tokeni za ingizoโฆ
24Tokeni za matokeoโฆ
17,130Tokeni za hojaโฆ
Qwen3.6 Plus PreviewModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Hitilafu ya API: 1Muda wa majibu (wastani)0msMuda wa majibu (upeo)0msMuda wa majibu (jumla)0msJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ
0msMuda wa majibu (wastani)โฆ
0Jumla ya tokeni za ingizoโฆ
0Tokeni za matokeoโฆ
0Tokeni za hojaโฆ
GLM 5 TurboModeli iliyohifadhiwa: modeli hii haitasasishwa tena wala kujaribiwa kwenye majaribio mapya.
3.0Wastani wa alama katika majaribio yote ya benchmark.โฆ
10.0Alama ya uthabiti inaonyesha utulivu kati ya run (10 = thabiti sana, hata ikiwa ni makosa mfululizo).โฆ
0.0%Kiwango cha kupita kwa kila jaribio = majaribio yaliyopita / jumla ya majaribio katika run zote.โฆ
0Majaribio yasiyo thabiti yalikuwa na matokeo mchanganyiko kati ya run (angalau kupita moja na kufeli moja).โฆ
Jaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.Jibu lisilo sahihi: 1Muda wa majibu (wastani)40.17sMuda wa majibu (upeo)40.17sMuda wa majibu (jumla)40.17sJaribio huhesabiwa kuwa limepita kikamilifu tu ikiwa run zake zote zimepita.โฆ