नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Pro Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium रिलीज़: 2026-02-14 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19
स्कोर 7.5 9.6
रैंक #36 #2
संगति 9.2 10.0
सही परीक्षण
प्रति प्रयास पास दर 66.7% 94.4%
अस्थिर टेस्ट 2 0
कुल रन 54 54
प्रति परिणाम लागत 0.333 3.400
कुल लागत $0.037 $0.578
???? ??? $0.100 / 1M $2.000 / 1M
????? ??? $0.400 / 1M $12.000 / 1M
आउटपुट टोकन 2,419 1,932
रीजनिंग टोकन 79,238 40,542
प्रतिक्रिया समय (औसत) 69.70s 15.96s
प्रतिक्रिया समय (अधिकतम) 262.83s 40.61s
प्रतिक्रिया समय (कुल) 1045.47s 175.52s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982

त्वरित तुलना

तुलना जोड़ी बदलें