9.6सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
7.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
प्रति निकाल खर्च
0.000हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
0.856हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
एकूण खर्च
$0.000एकूण खर्च…
$0.060एकूण खर्च…
बरोबर चाचण्या
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 9सूचनांचे पालन केले नाही: 2प्रतिसाद वेळ (सरासरी)3.15sप्रतिसाद वेळ (कमाल)8.91sप्रतिसाद वेळ (एकूण)50.46sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 5सूचनांचे पालन केले नाही: 3वेळ संपला: 1प्रतिसाद वेळ (सरासरी)47.94sप्रतिसाद वेळ (कमाल)204.02sप्रतिसाद वेळ (एकूण)431.47sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
प्रति प्रयत्न पास दर
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
60.4%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
अस्थिर चाचण्या
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
6अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एकूण रन
48एकूण रन…
48एकूण रन…
आउटपुट टोकन्स
1,837आउटपुट टोकन्स…
4,386आउटपुट टोकन्स…
रिझनिंग टोकन्स
0रिझनिंग टोकन्स…
142,080रिझनिंग टोकन्स…
प्रतिसाद वेळ (सरासरी)
3.15sप्रतिसाद वेळ (सरासरी)…
47.94sप्रतिसाद वेळ (सरासरी)…
प्रतिसाद वेळ (कमाल)
8.91sप्रतिसाद वेळ (कमाल)…
204.02sप्रतिसाद वेळ (कमाल)…
प्रतिसाद वेळ (एकूण)
50.46sप्रतिसाद वेळ (एकूण)…
431.47sप्रतिसाद वेळ (एकूण)…
स्कोअरनुसार शीर्ष मॉडेल्स
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)
श्रेणीवार तपशील
अँटी-एआय युक्त्या
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 3प्रतिसाद वेळ (सरासरी)3.59sप्रतिसाद वेळ (कमाल)8.17sप्रतिसाद वेळ (एकूण)10.78sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.59sप्रतिसाद वेळ (सरासरी)…
587आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
7.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
66.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)37.73sप्रतिसाद वेळ (कमाल)37.73sप्रतिसाद वेळ (एकूण)37.73sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
37.73sप्रतिसाद वेळ (सरासरी)…
1,107आउटपुट टोकन्स…
19,968रिझनिंग टोकन्स…
संयुक्त
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)8.91sप्रतिसाद वेळ (कमाल)8.91sप्रतिसाद वेळ (एकूण)8.91sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
8.91sप्रतिसाद वेळ (सरासरी)…
294आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)65.96sप्रतिसाद वेळ (कमाल)65.96sप्रतिसाद वेळ (एकूण)65.96sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
65.96sप्रतिसाद वेळ (सरासरी)…
578आउटपुट टोकन्स…
17,984रिझनिंग टोकन्स…
डेटा पार्सिंग आणि निष्कर्षण
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
9.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.26sप्रतिसाद वेळ (कमाल)4.66sप्रतिसाद वेळ (एकूण)6.52sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.26sप्रतिसाद वेळ (सरासरी)…
186आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
1.7सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
50.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2प्रतिसाद वेळ (सरासरी)21.42sप्रतिसाद वेळ (कमाल)21.42sप्रतिसाद वेळ (एकूण)21.42sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
21.42sप्रतिसाद वेळ (सरासरी)…
453आउटपुट टोकन्स…
10,560रिझनिंग टोकन्स…
डोमेन-विशिष्ट
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2प्रतिसाद वेळ (सरासरी)877msप्रतिसाद वेळ (कमाल)894msप्रतिसाद वेळ (एकूण)2.63sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
877msप्रतिसाद वेळ (सरासरी)…
25आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
4.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
55.6%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)204.02sप्रतिसाद वेळ (कमाल)204.02sप्रतिसाद वेळ (एकूण)204.02sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
204.02sप्रतिसाद वेळ (सरासरी)…
237आउटपुट टोकन्स…
64,448रिझनिंग टोकन्स…
Samanya Buddhimatta
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
9.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)2.86sप्रतिसाद वेळ (कमाल)2.86sप्रतिसाद वेळ (एकूण)2.86sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.86sप्रतिसाद वेळ (सरासरी)…
124आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)17.51sप्रतिसाद वेळ (कमाल)17.51sप्रतिसाद वेळ (एकूण)17.51sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
17.51sप्रतिसाद वेळ (सरासरी)…
202आउटपुट टोकन्स…
4,608रिझनिंग टोकन्स…
सूचनांचे पालन
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
3.5सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
6.7सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
16.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)1.09sप्रतिसाद वेळ (कमाल)1.23sप्रतिसाद वेळ (एकूण)2.19sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
1.09sप्रतिसाद वेळ (सरासरी)…
63आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
9.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
6.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
83.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)11.90sप्रतिसाद वेळ (कमाल)11.90sप्रतिसाद वेळ (एकूण)11.90sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
11.90sप्रतिसाद वेळ (सरासरी)…
382आउटपुट टोकन्स…
4,096रिझनिंग टोकन्स…
Puzzle Solving
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2प्रतिसाद वेळ (सरासरी)3.30sप्रतिसाद वेळ (कमाल)4.81sप्रतिसाद वेळ (एकूण)9.91sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.30sप्रतिसाद वेळ (सरासरी)…
291आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
44.4%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)19.81sप्रतिसाद वेळ (कमाल)21.31sप्रतिसाद वेळ (एकूण)39.63sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
19.81sप्रतिसाद वेळ (सरासरी)…
869आउटपुट टोकन्स…
13,440रिझनिंग टोकन्स…
टूल कॉलिंग
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
Trinity Large Preview
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)6.67sप्रतिसाद वेळ (कमाल)6.67sप्रतिसाद वेळ (एकूण)6.67sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
6.67sप्रतिसाद वेळ (सरासरी)…
267आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5 Nano
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)33.30sप्रतिसाद वेळ (कमाल)33.30sप्रतिसाद वेळ (एकूण)33.30sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…