एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 4सूचनांचे पालन केले नाही: 2प्रतिसाद वेळ (सरासरी)5.96sप्रतिसाद वेळ (कमाल)18.33sप्रतिसाद वेळ (एकूण)95.30sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 3API त्रुटी: 1सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)70.81sप्रतिसाद वेळ (कमाल)234.29sप्रतिसाद वेळ (एकूण)1132.90sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
सुसंगतता
8.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
7.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
प्रति निकाल खर्च
3.163हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
0.720हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
एकूण खर्च
$0.317एकूण खर्च…
$0.072एकूण खर्च…
प्रति प्रयत्न पास दर
70.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
81.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
अस्थिर चाचण्या
3अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
5अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
common.totalRuns
48 (16 x 3)common.totalRuns…
48 (16 x 3)common.totalRuns…
आउटपुट टोकन्स
19,272आउटपुट टोकन्स…
1,807आउटपुट टोकन्स…
रिझनिंग टोकन्स
0रिझनिंग टोकन्स…
169,952रिझनिंग टोकन्स…
प्रतिसाद वेळ (सरासरी)
5.96sप्रतिसाद वेळ (सरासरी)…
70.81sप्रतिसाद वेळ (सरासरी)…
प्रतिसाद वेळ (कमाल)
18.33sप्रतिसाद वेळ (कमाल)…
234.29sप्रतिसाद वेळ (कमाल)…
प्रतिसाद वेळ (एकूण)
95.30sप्रतिसाद वेळ (एकूण)…
1132.90sप्रतिसाद वेळ (एकूण)…
स्कोअरनुसार शीर्ष मॉडेल्स
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)
श्रेणीवार तपशील
अँटी-एआय युक्त्या
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
7.3सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
77.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)4.72sप्रतिसाद वेळ (कमाल)7.35sप्रतिसाद वेळ (एकूण)14.17sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
4.72sप्रतिसाद वेळ (सरासरी)…
3,091आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)71.35sप्रतिसाद वेळ (कमाल)168.31sप्रतिसाद वेळ (एकूण)214.06sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
71.35sप्रतिसाद वेळ (सरासरी)…
363आउटपुट टोकन्स…
23,645रिझनिंग टोकन्स…
संयुक्त
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)11.96sप्रतिसाद वेळ (कमाल)11.96sप्रतिसाद वेळ (एकूण)11.96sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
11.96sप्रतिसाद वेळ (सरासरी)…
2,614आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)17.78sप्रतिसाद वेळ (कमाल)17.78sप्रतिसाद वेळ (एकूण)17.78sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
17.78sप्रतिसाद वेळ (सरासरी)…
483आउटपुट टोकन्स…
8,270रिझनिंग टोकन्स…
डेटा पार्सिंग आणि निष्कर्षण
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
9.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)2.21sप्रतिसाद वेळ (कमाल)2.52sप्रतिसाद वेळ (एकूण)4.42sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.21sप्रतिसाद वेळ (सरासरी)…
942आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
5.5सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
5.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
83.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)56.99sप्रतिसाद वेळ (कमाल)80.14sप्रतिसाद वेळ (एकूण)113.98sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
56.99sप्रतिसाद वेळ (सरासरी)…
235आउटपुट टोकन्स…
16,237रिझनिंग टोकन्स…
डोमेन-विशिष्ट
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
4.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 3प्रतिसाद वेळ (सरासरी)13.01sप्रतिसाद वेळ (कमाल)18.33sप्रतिसाद वेळ (एकूण)39.04sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
13.01sप्रतिसाद वेळ (सरासरी)…
8,264आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
44.4%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)146.50sप्रतिसाद वेळ (कमाल)234.29sप्रतिसाद वेळ (एकूण)439.49sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
146.50sप्रतिसाद वेळ (सरासरी)…
58आउटपुट टोकन्स…
43,615रिझनिंग टोकन्स…
Samanya Buddhimatta
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)1.99sप्रतिसाद वेळ (कमाल)1.99sप्रतिसाद वेळ (एकूण)1.99sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
1.99sप्रतिसाद वेळ (सरासरी)…
319आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
5.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
3.1सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
66.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)40.05sप्रतिसाद वेळ (कमाल)40.05sप्रतिसाद वेळ (एकूण)40.05sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
40.05sप्रतिसाद वेळ (सरासरी)…
99आउटपुट टोकन्स…
38,486रिझनिंग टोकन्स…
सूचनांचे पालन
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
9.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
50.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)3.29sप्रतिसाद वेळ (कमाल)4.18sप्रतिसाद वेळ (एकूण)6.59sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.29sप्रतिसाद वेळ (सरासरी)…
1,455आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)63.49sप्रतिसाद वेळ (कमाल)111.61sप्रतिसाद वेळ (एकूण)126.98sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
63.49sप्रतिसाद वेळ (सरासरी)…
98आउटपुट टोकन्स…
14,139रिझनिंग टोकन्स…
Puzzle Solving
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)2.93sप्रतिसाद वेळ (कमाल)3.05sप्रतिसाद वेळ (एकूण)8.78sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.93sप्रतिसाद वेळ (सरासरी)…
1,726आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
4.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
4.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
77.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.वेळ संपला: 2प्रतिसाद वेळ (सरासरी)56.74sप्रतिसाद वेळ (कमाल)115.01sप्रतिसाद वेळ (एकूण)170.23sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
56.74sप्रतिसाद वेळ (सरासरी)…
162आउटपुट टोकन्स…
24,276रिझनिंग टोकन्स…
टूल कॉलिंग
स्कोअर
सुसंगतता
प्रति प्रयत्न पास दर
अस्थिर चाचण्या
बरोबर चाचण्या
प्रतिसाद वेळ (सरासरी)
आउटपुट टोकन्स
रिझनिंग टोकन्स
OpenAI: GPT-5.3 Chat
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)8.36sप्रतिसाद वेळ (कमाल)8.36sप्रतिसाद वेळ (एकूण)8.36sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
8.36sप्रतिसाद वेळ (सरासरी)…
861आउटपुट टोकन्स…
0रिझनिंग टोकन्स…
Qwen: Qwen3.5-Flash
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)10.33sप्रतिसाद वेळ (कमाल)10.33sप्रतिसाद वेळ (एकूण)10.33sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…