एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 4सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)65.09sप्रतिसाद वेळ (कमाल)262.83sप्रतिसाद वेळ (एकूण)846.14sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 4सूचनांचे पालन केले नाही: 2प्रतिसाद वेळ (सरासरी)5.96sप्रतिसाद वेळ (कमाल)18.33sप्रतिसाद वेळ (एकूण)95.30sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
सुसंगतता
9.1सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
8.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
प्रति निकाल खर्च
0.280हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
3.163हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
एकूण खर्च
$0.028एकूण खर्च…
$0.317एकूण खर्च…
प्रति प्रयत्न पास दर
68.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
70.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
अस्थिर चाचण्या
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
3अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
common.totalRuns
48 (16 x 3)common.totalRuns…
48 (16 x 3)common.totalRuns…
आउटपुट टोकन्स
1,965आउटपुट टोकन्स…
19,272आउटपुट टोकन्स…
रिझनिंग टोकन्स
58,456रिझनिंग टोकन्स…
0रिझनिंग टोकन्स…
प्रतिसाद वेळ (सरासरी)
65.09sप्रतिसाद वेळ (सरासरी)…
5.96sप्रतिसाद वेळ (सरासरी)…
प्रतिसाद वेळ (कमाल)
262.83sप्रतिसाद वेळ (कमाल)…
18.33sप्रतिसाद वेळ (कमाल)…
प्रतिसाद वेळ (एकूण)
846.14sप्रतिसाद वेळ (एकूण)…
95.30sप्रतिसाद वेळ (एकूण)…
स्कोअरनुसार शीर्ष मॉडेल्स
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)
श्रेणीवार तपशील
अँटी-एआय युक्त्या
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
7.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
66.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 1प्रतिसाद वेळ (सरासरी)98.99sप्रतिसाद वेळ (कमाल)182.10sप्रतिसाद वेळ (एकूण)296.96sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
98.99sप्रतिसाद वेळ (सरासरी)…
354आउटपुट टोकन्स…
9,352रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
7.3सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
77.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)4.72sप्रतिसाद वेळ (कमाल)7.35sप्रतिसाद वेळ (एकूण)14.17sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
4.72sप्रतिसाद वेळ (सरासरी)…
3,091आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
संयुक्त
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)262.83sप्रतिसाद वेळ (कमाल)262.83sप्रतिसाद वेळ (एकूण)262.83sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
262.83sप्रतिसाद वेळ (सरासरी)…
404आउटपुट टोकन्स…
29,806रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)11.96sप्रतिसाद वेळ (कमाल)11.96sप्रतिसाद वेळ (एकूण)11.96sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
11.96sप्रतिसाद वेळ (सरासरी)…
2,614आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
डेटा पार्सिंग आणि निष्कर्षण
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
9.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)24.27sप्रतिसाद वेळ (कमाल)27.52sप्रतिसाद वेळ (एकूण)48.54sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
24.27sप्रतिसाद वेळ (सरासरी)…
246आउटपुट टोकन्स…
2,743रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
9.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)2.21sप्रतिसाद वेळ (कमाल)2.52sप्रतिसाद वेळ (एकूण)4.42sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.21sप्रतिसाद वेळ (सरासरी)…
942आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
डोमेन-विशिष्ट
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 3प्रतिसाद वेळ (सरासरी)0msप्रतिसाद वेळ (कमाल)0msप्रतिसाद वेळ (एकूण)0msएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
0msप्रतिसाद वेळ (सरासरी)…
0आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
4.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 3प्रतिसाद वेळ (सरासरी)13.01sप्रतिसाद वेळ (कमाल)18.33sप्रतिसाद वेळ (एकूण)39.04sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
13.01sप्रतिसाद वेळ (सरासरी)…
8,264आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Samanya Buddhimatta
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
6.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
3.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)36.65sप्रतिसाद वेळ (कमाल)36.65sप्रतिसाद वेळ (एकूण)36.65sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
36.65sप्रतिसाद वेळ (सरासरी)…
213आउटपुट टोकन्स…
4,210रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)1.99sप्रतिसाद वेळ (कमाल)1.99sप्रतिसाद वेळ (एकूण)1.99sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
1.99sप्रतिसाद वेळ (सरासरी)…
319आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
सूचनांचे पालन
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)17.47sप्रतिसाद वेळ (कमाल)19.46sप्रतिसाद वेळ (एकूण)34.93sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
17.47sप्रतिसाद वेळ (सरासरी)…
69आउटपुट टोकन्स…
2,050रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
9.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
50.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)3.29sप्रतिसाद वेळ (कमाल)4.18sप्रतिसाद वेळ (एकूण)6.59sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.29sप्रतिसाद वेळ (सरासरी)…
1,455आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Puzzle Solving
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
7.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
88.9%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)25.85sप्रतिसाद वेळ (कमाल)32.95sप्रतिसाद वेळ (एकूण)77.55sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
25.85sप्रतिसाद वेळ (सरासरी)…
457आउटपुट टोकन्स…
5,060रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)2.93sप्रतिसाद वेळ (कमाल)3.05sप्रतिसाद वेळ (एकूण)8.78sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.93sप्रतिसाद वेळ (सरासरी)…
1,726आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
टूल कॉलिंग
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
ByteDance Seed: Seed-2.0-Mini
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)88.68sप्रतिसाद वेळ (कमाल)88.68sप्रतिसाद वेळ (एकूण)88.68sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
88.68sप्रतिसाद वेळ (सरासरी)…
222आउटपुट टोकन्स…
5,235रिझनिंग टोकन्स…
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)8.36sप्रतिसाद वेळ (कमाल)8.36sप्रतिसाद वेळ (एकूण)8.36sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…