Google: Gemini 3.5 Flash vs Grok 4.20 Multi Agent Beta
सारांश
Gemini 3.5 Flash vs Grok 4.20 Multi Agent Beta benchmark तुलना: Gemini 3.5 Flash average score मध्ये पुढे आहे: 9.6 vs 6.6. Gemini 3.5 Flash चा benchmark खर्च कमी आहे: $1.115 vs $5.599. Gemini 3.5 Flash वेगवान आहे: 8.84s vs 9.69s, pass rates 96.8% vs 59.3%.
शिफारस केलेले मॉडेल: Gemini 3.5 Flash - It has the best score here (9.6), while costing about 5.0x less than Grok 4.20 Multi Agent Beta.
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-10
10.0पहिल्या प्रयत्नातील यश स्कोअर: 10.0 म्हणजे यशस्वी कॉल्सपूर्वी लक्ष्य API किंवा रेट-लिमिटच्या पुन्हा प्रयत्न करता येणाऱ्या अपयशांची नोंद नाही; नोंदवलेली अपयशे स्कोअर कमी करतात.…
लागू नाहीपहिल्या प्रयत्नातील यश स्कोअर: 10.0 म्हणजे यशस्वी कॉल्सपूर्वी लक्ष्य API किंवा रेट-लिमिटच्या पुन्हा प्रयत्न करता येणाऱ्या अपयशांची नोंद नाही; नोंदवलेली अपयशे स्कोअर कमी करतात.…
सुसंगतता
9.6सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
7.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
बरोबर चाचण्या
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)8.84sप्रतिसाद वेळ (कमाल)34.82sप्रतिसाद वेळ (एकूण)185.57sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 4API त्रुटी: 2अतिरिक्त फॉरमॅटिंग: 2सूचनांचे पालन केले नाही: 2प्रतिसाद वेळ (सरासरी)9.69sप्रतिसाद वेळ (कमाल)35.28sप्रतिसाद वेळ (एकूण)155.07sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
प्रति प्रयत्न पास दर
96.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
59.3%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
अस्थिर चाचण्या
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
5अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एकूण रन
63एकूण रन…
52एकूण रन…
प्रति निकाल खर्च
5.575हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
62.923हे बेंचमार्कमधील प्रत्येक बरोबर उत्तरामागील सरासरी खर्च सेंट्समध्ये दाखवते (कमी असणे चांगले).…
एकूण खर्च
$1.115एकूण खर्च (सध्याची किंमत)…
$5.599एकूण खर्च (सध्याची किंमत)…
इनपुट किंमत
$1.500 / 1Mइनपुट किंमत…
$4.235 / 1Mइनपुट किंमत…
आउटपुट किंमत
$9.000 / 1Mआउटपुट किंमत…
$4.235 / 1Mआउटपुट किंमत…
एकूण इनपुट टोकन्स
37,594एकूण इनपुट टोकन्स…
721,952एकूण इनपुट टोकन्स…
आउटपुट टोकन्स
1,975आउटपुट टोकन्स…
294,668आउटपुट टोकन्स…
रिझनिंग टोकन्स
115,638रिझनिंग टोकन्स…
305,374रिझनिंग टोकन्स…
प्रतिसाद वेळ (सरासरी)
8.84sप्रतिसाद वेळ (सरासरी)…
9.69sप्रतिसाद वेळ (सरासरी)…
प्रतिसाद वेळ (कमाल)
34.82sप्रतिसाद वेळ (कमाल)…
35.28sप्रतिसाद वेळ (कमाल)…
प्रतिसाद वेळ (एकूण)
185.57sप्रतिसाद वेळ (एकूण)…
155.07sप्रतिसाद वेळ (एकूण)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)2.57sप्रतिसाद वेळ (कमाल)3.60sप्रतिसाद वेळ (एकूण)10.27sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
2.57sप्रतिसाद वेळ (सरासरी)…
492एकूण इनपुट टोकन्स…
174आउटपुट टोकन्स…
4,997रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
6.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
5.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
75.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
2अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अतिरिक्त फॉरमॅटिंग: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)3.46sप्रतिसाद वेळ (कमाल)4.38sप्रतिसाद वेळ (एकूण)13.86sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)22.96sप्रतिसाद वेळ (कमाल)34.82sप्रतिसाद वेळ (एकूण)68.88sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
22.96sप्रतिसाद वेळ (सरासरी)…
8,118एकूण इनपुट टोकन्स…
456आउटपुट टोकन्स…
47,129रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)27.11sप्रतिसाद वेळ (कमाल)27.11sप्रतिसाद वेळ (एकूण)27.11sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)22.37sप्रतिसाद वेळ (कमाल)22.37sप्रतिसाद वेळ (एकूण)22.37sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
22.37sप्रतिसाद वेळ (सरासरी)…
12,873एकूण इनपुट टोकन्स…
351आउटपुट टोकन्स…
16,323रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)0msप्रतिसाद वेळ (कमाल)0msप्रतिसाद वेळ (एकूण)0msएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)6.43sप्रतिसाद वेळ (कमाल)8.51sप्रतिसाद वेळ (एकूण)12.87sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
6.43sप्रतिसाद वेळ (सरासरी)…
7,548एकूण इनपुट टोकन्स…
279आउटपुट टोकन्स…
8,466रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
10.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)5.54sप्रतिसाद वेळ (कमाल)7.51sप्रतिसाद वेळ (एकूण)11.08sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
77.8%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)14.09sप्रतिसाद वेळ (कमाल)22.00sप्रतिसाद वेळ (एकूण)42.27sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
14.09sप्रतिसाद वेळ (सरासरी)…
633एकूण इनपुट टोकन्स…
12आउटपुट टोकन्स…
24,721रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
2.9सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.2सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
11.1%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.चुकीचे उत्तर: 2अतिरिक्त फॉरमॅटिंग: 1प्रतिसाद वेळ (सरासरी)24.67sप्रतिसाद वेळ (कमाल)35.28sप्रतिसाद वेळ (एकूण)74.02sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.63sप्रतिसाद वेळ (कमाल)3.63sप्रतिसाद वेळ (एकूण)3.63sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.63sप्रतिसाद वेळ (सरासरी)…
486एकूण इनपुट टोकन्स…
115आउटपुट टोकन्स…
1,650रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
5.8सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
2.8सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
66.7%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1प्रतिसाद वेळ (सरासरी)6.40sप्रतिसाद वेळ (कमाल)6.40sप्रतिसाद वेळ (एकूण)6.40sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.35sप्रतिसाद वेळ (कमाल)3.42sप्रतिसाद वेळ (एकूण)6.69sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.35sप्रतिसाद वेळ (सरासरी)…
615एकूण इनपुट टोकन्स…
70आउटपुट टोकन्स…
3,799रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
9.8सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.52sप्रतिसाद वेळ (कमाल)3.80sप्रतिसाद वेळ (एकूण)7.04sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.23sप्रतिसाद वेळ (कमाल)3.68sप्रतिसाद वेळ (एकूण)9.69sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.23sप्रतिसाद वेळ (सरासरी)…
558एकूण इनपुट टोकन्स…
241आउटपुट टोकन्स…
4,940रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
6.7सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
7.9सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
55.6%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
1अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.सूचनांचे पालन केले नाही: 1चुकीचे उत्तर: 1प्रतिसाद वेळ (सरासरी)5.19sप्रतिसाद वेळ (कमाल)5.49sप्रतिसाद वेळ (एकूण)15.57sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)4.96sप्रतिसाद वेळ (कमाल)4.96sप्रतिसाद वेळ (एकूण)4.96sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
4.96sप्रतिसाद वेळ (सरासरी)…
6,115एकूण इनपुट टोकन्स…
265आउटपुट टोकन्स…
1,608रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.
3.0सर्व बेंचमार्क चाचण्यांमधील सरासरी गुण.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
0.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.API त्रुटी: 1प्रतिसाद वेळ (सरासरी)0msप्रतिसाद वेळ (कमाल)0msप्रतिसाद वेळ (एकूण)0msएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
10.0सुसंगतता गुण रन्समधील स्थिरता दाखवतो (10 = अतिशय सुसंगत, सतत चूक असली तरी).…
100.0%प्रति प्रयत्न पास दर = पास प्रयत्न / सर्व रन्समधील एकूण प्रयत्न.…
0अस्थिर चाचण्यांत रन्समध्ये मिश्र निकाल असतात (किमान एक पास आणि एक फेल).…
एखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.अयशस्वी उत्तरे नाहीत.प्रतिसाद वेळ (सरासरी)3.94sप्रतिसाद वेळ (कमाल)3.94sप्रतिसाद वेळ (एकूण)3.94sएखादी चाचणी तेव्हाच पूर्णपणे पास मानली जाते जेव्हा तिचे सर्व रन पास होतात.…
3.94sप्रतिसाद वेळ (सरासरी)…
156एकूण इनपुट टोकन्स…
12आउटपुट टोकन्स…
2,005रिझनिंग टोकन्स…
Grok 4.20 Multi Agent Betaसंग्रहित मॉडेल: हे मॉडेल आता अपडेट केले जाणार नाही आणि नवीन चाचण्यांवर तपासले जाणार नाही.