9.1संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
9.6संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
प्रति परिणाम लागत
0.280यह बेंचमार्क के प्रति सही उत्तर की औसत लागत सेंट में दिखाता है (कम होना बेहतर है)।…
19.243यह बेंचमार्क के प्रति सही उत्तर की औसत लागत सेंट में दिखाता है (कम होना बेहतर है)।…
कुल लागत
$0.028कुल लागत…
$2.310कुल लागत…
सही परीक्षण
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।समय समाप्त: 4निर्देशों का पालन नहीं किया: 1गलत उत्तर: 1प्रतिक्रिया समय (औसत)65.09sप्रतिक्रिया समय (अधिकतम)262.83sप्रतिक्रिया समय (कुल)846.14sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 3निर्देशों का पालन नहीं किया: 1प्रतिक्रिया समय (औसत)68.83sप्रतिक्रिया समय (अधिकतम)280.52sप्रतिक्रिया समय (कुल)1101.32sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
प्रति प्रयास पास दर
68.8%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
77.1%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
अस्थिर टेस्ट
2अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
common.totalRuns
48 (16 x 3)common.totalRuns…
48 (16 x 3)common.totalRuns…
आउटपुट टोकन
1,965आउटपुट टोकन…
1,283आउटपुट टोकन…
रीजनिंग टोकन
58,456रीजनिंग टोकन…
1,533,310रीजनिंग टोकन…
प्रतिक्रिया समय (औसत)
65.09sप्रतिक्रिया समय (औसत)…
68.83sप्रतिक्रिया समय (औसत)…
प्रतिक्रिया समय (अधिकतम)
262.83sप्रतिक्रिया समय (अधिकतम)…
280.52sप्रतिक्रिया समय (अधिकतम)…
प्रतिक्रिया समय (कुल)
846.14sप्रतिक्रिया समय (कुल)…
1101.32sप्रतिक्रिया समय (कुल)…
स्कोर के अनुसार शीर्ष मॉडल
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
औसत स्कोर vs प्रतिक्रिया समय (औसत)
श्रेणी विवरण
एंटी-एआई ट्रिक्स
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
7.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
66.7%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।समय समाप्त: 1प्रतिक्रिया समय (औसत)98.99sप्रतिक्रिया समय (अधिकतम)182.10sप्रतिक्रिया समय (कुल)296.96sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
98.99sप्रतिक्रिया समय (औसत)…
354आउटपुट टोकन…
9,352रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)43.87sप्रतिक्रिया समय (अधिकतम)121.88sप्रतिक्रिया समय (कुल)131.62sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
43.87sप्रतिक्रिया समय (औसत)…
144आउटपुट टोकन…
193,077रीजनिंग टोकन…
संयुक्त
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)262.83sप्रतिक्रिया समय (अधिकतम)262.83sप्रतिक्रिया समय (कुल)262.83sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
262.83sप्रतिक्रिया समय (औसत)…
404आउटपुट टोकन…
29,806रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)280.52sप्रतिक्रिया समय (अधिकतम)280.52sप्रतिक्रिया समय (कुल)280.52sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
280.52sप्रतिक्रिया समय (औसत)…
335आउटपुट टोकन…
380,440रीजनिंग टोकन…
डेटा पार्सिंग और निष्कर्षण
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
9.9सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)24.27sप्रतिक्रिया समय (अधिकतम)27.52sप्रतिक्रिया समय (कुल)48.54sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
24.27sप्रतिक्रिया समय (औसत)…
246आउटपुट टोकन…
2,743रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
9.9सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)7.16sप्रतिक्रिया समय (अधिकतम)8.54sप्रतिक्रिया समय (कुल)14.31sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
7.16sप्रतिक्रिया समय (औसत)…
279आउटपुट टोकन…
6,186रीजनिंग टोकन…
डोमेन-विशिष्ट
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
0.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।समय समाप्त: 3प्रतिक्रिया समय (औसत)0msप्रतिक्रिया समय (अधिकतम)0msप्रतिक्रिया समय (कुल)0msकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
0msप्रतिक्रिया समय (औसत)…
0आउटपुट टोकन…
0रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
4.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
33.3%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 2प्रतिक्रिया समय (औसत)127.58sप्रतिक्रिया समय (अधिकतम)133.93sप्रतिक्रिया समय (कुल)382.74sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
127.58sप्रतिक्रिया समय (औसत)…
18आउटपुट टोकन…
566,202रीजनिंग टोकन…
Samanya Buddhimatta
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
6.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
3.4संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
33.3%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।निर्देशों का पालन नहीं किया: 1प्रतिक्रिया समय (औसत)36.65sप्रतिक्रिया समय (अधिकतम)36.65sप्रतिक्रिया समय (कुल)36.65sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
36.65sप्रतिक्रिया समय (औसत)…
213आउटपुट टोकन…
4,210रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)5.25sप्रतिक्रिया समय (अधिकतम)5.25sप्रतिक्रिया समय (कुल)5.25sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
5.25sप्रतिक्रिया समय (औसत)…
117आउटपुट टोकन…
3,915रीजनिंग टोकन…
निर्देश पालन
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)17.47sप्रतिक्रिया समय (अधिकतम)19.46sप्रतिक्रिया समय (कुल)34.93sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
17.47sप्रतिक्रिया समय (औसत)…
69आउटपुट टोकन…
2,050रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
9.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
6.9संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
66.7%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।निर्देशों का पालन नहीं किया: 1प्रतिक्रिया समय (औसत)70.07sप्रतिक्रिया समय (अधिकतम)136.53sप्रतिक्रिया समय (कुल)140.14sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
70.07sप्रतिक्रिया समय (औसत)…
69आउटपुट टोकन…
190,053रीजनिंग टोकन…
Puzzle Solving
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
7.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
7.2संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
88.9%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
1अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)25.85sप्रतिक्रिया समय (अधिकतम)32.95sप्रतिक्रिया समय (कुल)77.55sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
25.85sप्रतिक्रिया समय (औसत)…
457आउटपुट टोकन…
5,060रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
7.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
66.7%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।गलत उत्तर: 1प्रतिक्रिया समय (औसत)46.33sप्रतिक्रिया समय (अधिकतम)134.22sप्रतिक्रिया समय (कुल)139.00sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
46.33sप्रतिक्रिया समय (औसत)…
87आउटपुट टोकन…
190,953रीजनिंग टोकन…
टूल कॉलिंग
स्कोर
संगति
प्रति प्रयास पास दर
अस्थिर टेस्ट
सही परीक्षण
प्रतिक्रिया समय (औसत)
आउटपुट टोकन
रीजनिंग टोकन
ByteDance Seed: Seed-2.0-Mini
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)88.68sप्रतिक्रिया समय (अधिकतम)88.68sप्रतिक्रिया समय (कुल)88.68sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…
88.68sप्रतिक्रिया समय (औसत)…
222आउटपुट टोकन…
5,235रीजनिंग टोकन…
Google: Gemini 3.1 Flash Lite Preview
10.0सभी बेंचमार्क परीक्षणों का औसत स्कोर।…
10.0संगति स्कोर रनों के बीच स्थिरता दिखाता है (10 = बहुत स्थिर, भले लगातार गलत हो)।…
100.0%प्रति प्रयास पास दर = पास प्रयास / सभी रनों में कुल प्रयास।…
0अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।…
कोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।कोई विफल उत्तर नहीं।प्रतिक्रिया समय (औसत)7.73sप्रतिक्रिया समय (अधिकतम)7.73sप्रतिक्रिया समय (कुल)7.73sकोई टेस्ट तभी पूरी तरह पास माना जाएगा जब उसके सभी रन पास हों।…