Nemotron 3 Ultra 550b A55b vs Grok 4.20 Multi Agent Beta
सारांश
Nemotron 3 Ultra 550b A55b vs Grok 4.20 Multi Agent Beta benchmark तुलना: Nemotron 3 Ultra 550b A55b average score मध्ये पुढे आहे: 7.5 vs 6.6. Nemotron 3 Ultra 550b A55b चा benchmark खर्च कमी आहे: $0.177 vs $5.599. Grok 4.20 Multi Agent Beta वेगवान आहे: 9.69s vs 15.05s, pass rates 69.8% vs 59.3%.
शिफारस केलेले मॉडेल: Nemotron 3 Ultra 550b A55b - It has the best score here (7.5), while costing about 31.8x less than Grok 4.20 Multi Agent Beta.
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-10
9.7पहिल्या प्रयत्नातील यश स्कोअर: 10.0 म्हणजे यशस्वी कॉल्सपूर्वी लक्ष्य API किंवा रेट-लिमिटच्या पुन्हा प्रयत्न करता येणाऱ्या अपयशांची नोंद नाही; नोंदवलेली अपयशे स्कोअर कमी करतात.…
लागू नाहीपहिल्या प्रयत्नातील यश स्कोअर: 10.0 म्हणजे यशस्वी कॉल्सपूर्वी लक्ष्य API किंवा रेट-लिमिटच्या पुन्हा प्रयत्न करता येणाऱ्या अपयशांची नोंद नाही; नोंदवलेली अपयशे स्कोअर कमी करतात.…
सुसंगतता
8.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
7.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
बरोबर चाचण्या
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 7API त्रुटी: 1प्रतिसाद वेळ (सरासरी)15.05sप्रतिसाद वेळ (कमाल)43.93sप्रतिसाद वेळ (एकूण)316.09sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 4API त्रुटी: 2अतिरिक्त फॉरमॅटिंग: 2सूचनांचे पालन केले नाही: 2प्रतिसाद वेळ (सरासरी)9.69sप्रतिसाद वेळ (कमाल)35.28sप्रतिसाद वेळ (एकूण)155.07sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
प्रति प्रयत्न पास दर
69.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
59.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
अस्थिर चाचण्या
3अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
5अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एकूण रन
63एकूण रन…
52एकूण रन…
प्रति निकाल खर्च
0.000हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
62.923हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
एकूण खर्च
$0.177एकूण खर्च (सध्याची किंमत)…
$5.599एकूण खर्च (सध्याची किंमत)…
इनपुट किंमत
$0.500 / 1Mइनपुट किंमत…
$4.235 / 1Mइनपुट किंमत…
आउटपुट किंमत
$2.500 / 1Mआउटपुट किंमत…
$4.235 / 1Mआउटपुट किंमत…
एकूण इनपुट टोकन्स
46,813एकूण इनपुट टोकन्स…
721,952एकूण इनपुट टोकन्स…
आउटपुट टोकन्स
18,002आउटपुट टोकन्स…
294,668आउटपुट टोकन्स…
रिझनिंग टोकन्स
53,091रिझनिंग टोकन्स…
305,374रिझनिंग टोकन्स…
प्रतिसाद वेळ (सरासरी)
15.05sप्रतिसाद वेळ (सरासरी)…
9.69sप्रतिसाद वेळ (सरासरी)…
प्रतिसाद वेळ (कमाल)
43.93sप्रतिसाद वेळ (कमाल)…
35.28sप्रतिसाद वेळ (कमाल)…
प्रतिसाद वेळ (एकूण)
316.09sप्रतिसाद वेळ (एकूण)…
155.07sप्रतिसाद वेळ (एकूण)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#42 Nemotron 3 Ultra 550b A55b
medium
No showcase result has been generated for this model yet.
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)8.62sप्रतिसाद वेळ (कमाल)16.86sप्रतिसाद वेळ (एकूण)34.49sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
8.62sप्रतिसाद वेळ (सरासरी)…
780एकूण इनपुट टोकन्स…
835आउटपुट टोकन्स…
1,485रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
6.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
5.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
75.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अतिरिक्त फॉरमॅटिंग: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)3.46sप्रतिसाद वेळ (कमाल)4.38sप्रतिसाद वेळ (एकूण)13.86sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
7.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
88.9%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)26.53sप्रतिसाद वेळ (कमाल)31.91sप्रतिसाद वेळ (एकूण)79.58sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
26.53sप्रतिसाद वेळ (सरासरी)…
7,686एकूण इनपुट टोकन्स…
2,854आउटपुट टोकन्स…
17,725रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)27.11sप्रतिसाद वेळ (कमाल)27.11sप्रतिसाद वेळ (एकूण)27.11sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)43.93sप्रतिसाद वेळ (कमाल)43.93sप्रतिसाद वेळ (एकूण)43.93sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
43.93sप्रतिसाद वेळ (सरासरी)…
17,574एकूण इनपुट टोकन्स…
1,040आउटपुट टोकन्स…
3,590रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)0msप्रतिसाद वेळ (कमाल)0msप्रतिसाद वेळ (एकूण)0msएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)5.68sप्रतिसाद वेळ (कमाल)7.94sप्रतिसाद वेळ (एकूण)11.36sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
5.68sप्रतिसाद वेळ (सरासरी)…
7,989एकूण इनपुट टोकन्स…
473आउटपुट टोकन्स…
1,285रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)5.54sप्रतिसाद वेळ (कमाल)7.51sप्रतिसाद वेळ (एकूण)11.08sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
4.4सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 3प्रतिसाद वेळ (सरासरी)24.90sप्रतिसाद वेळ (कमाल)34.96sप्रतिसाद वेळ (एकूण)74.71sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
24.90sप्रतिसाद वेळ (सरासरी)…
858एकूण इनपुट टोकन्स…
11,169आउटपुट टोकन्स…
16,249रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
2.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
11.1%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2अतिरिक्त फॉरमॅटिंग: 1प्रतिसाद वेळ (सरासरी)24.67sप्रतिसाद वेळ (कमाल)35.28sप्रतिसाद वेळ (एकूण)74.02sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
9.5सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)2.52sप्रतिसाद वेळ (कमाल)2.52sप्रतिसाद वेळ (एकूण)2.52sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.52sप्रतिसाद वेळ (सरासरी)…
360एकूण इनपुट टोकन्स…
70आउटपुट टोकन्स…
235रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
5.8सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
2.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
66.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)6.40sप्रतिसाद वेळ (कमाल)6.40sप्रतिसाद वेळ (एकूण)6.40sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)6.35sप्रतिसाद वेळ (कमाल)9.38sप्रतिसाद वेळ (एकूण)12.69sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
6.35sप्रतिसाद वेळ (सरासरी)…
765एकूण इनपुट टोकन्स…
182आउटपुट टोकन्स…
1,243रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
9.8सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.52sप्रतिसाद वेळ (कमाल)3.80sप्रतिसाद वेळ (एकूण)7.04sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
9.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
33.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2प्रतिसाद वेळ (सरासरी)3.54sप्रतिसाद वेळ (कमाल)6.03sप्रतिसाद वेळ (एकूण)10.62sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.54sप्रतिसाद वेळ (सरासरी)…
792एकूण इनपुट टोकन्स…
771आउटपुट टोकन्स…
2,055रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
6.7सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
55.6%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)5.19sप्रतिसाद वेळ (कमाल)5.49sप्रतिसाद वेळ (एकूण)15.57sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)7.72sप्रतिसाद वेळ (कमाल)7.72sप्रतिसाद वेळ (एकूण)7.72sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
7.72sप्रतिसाद वेळ (सरासरी)…
9,781एकूण इनपुट टोकन्स…
304आउटपुट टोकन्स…
984रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)0msप्रतिसाद वेळ (कमाल)0msप्रतिसाद वेळ (एकूण)0msएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)38.47sप्रतिसाद वेळ (कमाल)38.47sप्रतिसाद वेळ (एकूण)38.47sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
38.47sप्रतिसाद वेळ (सरासरी)…
228एकूण इनपुट टोकन्स…
304आउटपुट टोकन्स…
8,240रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.