नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Flash Lite

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-08

मेट्रिक Seed-2.0-Mini Seed-2.0-Mini medium रिलीज़: 2026-02-14 Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal रिलीज़: 2026-05-08
स्कोर 7.2 6.8
रैंक #56 #68
विश्वसनीयता 3.3 10.0
संगति 9.2 8.7
सही परीक्षण
प्रति प्रयास पास दर 63.2% 59.7%
अस्थिर टेस्ट 2 3
कुल रन 57 57
प्रति परिणाम लागत 0.339 0.111
कुल लागत $0.038 $0.012
???? ??? $0.100 / 1M $0.250 / 1M
????? ??? $0.400 / 1M $1.500 / 1M
आउटपुट टोकन 2,469 2,457
रीजनिंग टोकन 81,017 0
प्रतिक्रिया समय (औसत) 68.89s 1.41s
प्रतिक्रिया समय (अधिकतम) 262.83s 4.49s
प्रतिक्रिया समय (कुल) 1102.23s 26.72s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 197.31s 448 20,614
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0

त्वरित तुलना

तुलना जोड़ी बदलें